Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 636
Aluna: Juscimara Gomes Avelino
Orientador: Prof. George Darmiton da Cunha Cavalcanti
Coorientador: Prof. Rafael Menelau Oliveira e Cruz (École de Technologie Supérieure)
Título: Imbalanced Regression Pipeline Recommendation
Data: 26/08/2024
Hora/Local: 9h – Presencial – Anfiteatro do Centro de Informática
Banca Examinadora:
Prof. Ricardo Bastos Cavalcante Prudêncio (UFPE / Centro de Informática)
Prof. Tsang Ing Ren (UFPE / Centro de Informática)
Prof. Ana Carolina Lorena (ITA – Instituto Tecnológico de Aeronáutica)
Prof. Péricles Barbosa Cunha de Miranda (UFRPE / Departamento de Computação)
Prof. Alceu de Souza Britto Jr (PUC-PR / Centro de Ciências Exatas e de Tecnologia)
RESUMO:
Problemas de desbalanceamento são comuns em diversos cenários do mundo real e apresentam desafios significativos, especialmente para tarefas de regressão, devido à raridade de certos valores-alvo contínuos. Embora essas questões tenham sido amplamente exploradas em tarefas de classificação, elas também afetam a regressão, complicando o desempenho dos modelos. Este trabalho apresenta um estudo experimental extenso envolvendo várias estratégias de balanceamento e modelos de aprendizado, introduzimos uma taxonomia para abordagens de regressão desbalanceada baseada em modelos de regressão, modificação no processo de aprendizado e métricas de avaliação, e destaca novos insights sobre as vantagens de diferentes estratégias. A partir deste estudo, ficou evidente que a escolha do método de reamostragem depende do problema, dos modelos de aprendizado e das métricas, tornando difícil selecionar uma estratégia de reamostragem e um modelo de aprendizado apropriados. Como resultado, é necessário testar a maioria das combinações existentes. Com base nessas descobertas, este trabalho propõe o modelo Meta-learning for Imbalanced Regression (Meta-IR) para enfrentar esses desafios. O Meta-IR recomenda pipelines ideais que consistem em estratégias de reamostragem e modelos de aprendizado para tarefas de regressão desbalanceada. Duas formulações são propostas: Independente, que recomenda separadamente algoritmos de aprendizado e estratégias de reamostragem, e Encadeada, que modela suas interdependências sequencialmente. A abordagem Encadeada demonstrou desempenho superior, sugerindo uma relação significativa entre algoritmos de aprendizado e estratégias de reamostragem. Em comparação com modelos de AutoML e configurações de linha de base, o Meta-IR superou todos, oferecendo uma solução mais eficaz para a regressão desbalanceada e indicando direções para futuras pesquisas.
Palavras-chave: Regressão desbalanceada, Estratégias de reamostragem, Meta-aprendizado
Comentários desativados