Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 581
Aluno: José Thiago Holanda de Alcântara Cabral
Orientador: Prof. Adriano Lorena Inácio de Oliveira
Título: Um Framework para Seleção Dinâmica de Múltiplos Modelos de
Regressão Heterogêneos: aplicações em estimativa de esforço de software
Data: 17/11/2022
Hora/Local: 13h – Virtual – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Prof. Fabio Queda Bueno da Silva (UFPE / Centro de Informática)
Profa. Renata Maria Cardoso Rodrigues de Souza (UFPE / Centro de Informática)
Prof. George Gomes Cabral (UFRPE / Departamento de Computação)
Prof. Roberta Andrade de Araújo Fagundes (UPE / Escola Politécnica de Pernambuco)
Prof. Telmo de Menezes e Silva Filho (University of Bristol)
RESUMO:
A utilização de algoritmos de Aprendizagem de Máquina (AM) tem sido cada
vez mais comum em diversas áreas do conhecimento. Na Engenharia de Software
(ES), a estimativa de esforço é uma tarefa difícil e normalmente requer
bastante conhecimento técnico dos gestores. Vários estudos da literatura
têm abordado o processo de Estimativa de Esforço de Software (EES) de
diferentes maneiras. Os métodos usados vão desde os tradicionais, que não
utilizam aprendizagem, até os sistemas de múltiplos modelos de AM. As
estratégias usadas nessas combinações têm sido um importante tópico de
pesquisa em AM, visto que o uso de múltiplos modelos tem melhorado a
acurácia das previsões em relação aos modelos usados individualmente. Este
trabalho propõe um framework para seleção dinâmica de múltiplos modelos de
regressão heterogêneos. Inicialmente, os dados são separados em conjuntos
de treinamento, validação e teste. Um amplo conjunto de algoritmos de
regressão é treinado e validado. De acordo com os resultados, três
diferentes modelos são selecionados a partir do desempenho individual de
cada um e da diversidade existente entre eles (Conjunto Básico). Em
seguida, diferentes classificadores são avaliados, consequentemente, um
conjunto de modelos de classificação é definido como meio para selecionar
um grupo de regressores para cada instância avaliada. Desta forma, um grupo
de classificadores também é selecionado para o conjunto de dados. Ao fim da
fase de treinamento e validação, na fase de teste, os melhores
classificadores avaliados são usados para selecionar dinamicamente modelos
de regressão a partir do Conjunto Básico de regressores. A previsão final é
dada pela combinação das previsões dos modelos de regressão selecionados
pelos classificadores. Análises experimentais considerando dois
repositórios relevantes em problemas de EES são apresentadas. Além desses
repositórios, seis bases de dados educacionais também foram investigadas
com o propósito de analisar o comportamento do método proposto com dados de
um contexto diferente, e com metas-características distintas das bases de
EES. Os experimentos utilizaram cinco métricas para análise dos resultados,
sendo a média do erro absoluto usada para fins de testes estatísticos. Os
resultados demonstraram que os métodos gerados a partir do framework
proposto superaram, na maioria das vezes, os modelos individuais, assim
como diferentes estratégias de combinações desses modelos. Tais estratégias
utilizaram combinações com seleção estática e dinâmica.
Palavras-chave: Modelos de Aprendizagem de Máquina. Estimativa de Esforço
de Software. Combinação de Modelos. Seleção Dinâmica. Seleção Dinâmica de
Múltiplos Modelos.
Comentários desativados