Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 2.017
Aluno: Juscelino Sebastião Avelino Júnior
Orientador: Prof. George Darmiton da Cunha Cavalcanti
Título: Uma abordagem de seleção dinâmica de classificadores para predição
de defeitos de software
Data: 16/03/2022
Hora/Local: 14h – Virtual – interessados entrar em contato com o aluno
Banca Examinadora:
Prof. George Darmiton da Cunha Cavalcanti (UFPE / Centro de Informática)
Prof. Rafael Menelau Oliveira e Cruz (Ecole de Tecnologie Superiéure)
Prof. Araken de Medeiros Santos(UFERSA / Departamento de Ciências Exatas e
Tecnologia da Informação)
RESUMO:
A predição de defeitos é uma tarefa que visa alocar recursos e informações
para predizer módulos de software propensos a defeitos. Contudo, devido a
necessidade de quantidades suficientemente grandes de dados requeridas
pelos modelos, pesquisadores tem se concentrado em pesquisas sobre
Cross-Project Defect Prediction (CPDP). Essa abordagem envolve construir
modelos usando um conjunto de treinamento composto por informações de
diversos projetos externos. Diversas abordagens CPDP propostas na
literatura utilizam abordagens tradicionais como, por exemplo,
normalização/transformação dos dados através do logaritmo ou uso de
algoritmos de aprendizagem de máquina, entretanto, essas abordagens não
possuem nenhum mecanismo capaz de selecionar um classificador ou um
conjunto de classificadores mais apto em predizer uma determinada amostra
de teste. Logo, a seleção dinâmica de classificadores é uma abordagem ao
qual seleciona classificadores básicos em tempo real de acordo com cada
amostra de teste a ser classificada. Neste contexto e considerando as
limitações das abordagens CPDP tradicionais, propomos uma abordagem CPDP
que, com base nos dados de treinamento, seleciona a melhor configuração de
parâmetros (técnica de seleção dinâmica de classificadores, classificador
básico e tamanho do pool de classificadores) para classificaras novas
amostras de entrada (dados de teste). A abordagem proposta é composta por
três etapas: Definição do Alvo, Superprodução e Avaliação do Modelo.
Portanto, nessa dissertação são almejados quatro principais pontos.
Primeiro, é conduzida uma análise experimental para investigar o
comportamento da abordagem proposta na predição de defeitos de software.
Segundo, são realizadas comparações entre a abordagem proposta versus
abordagens CPDP da literatura. Neste contexto, foram investigados quais
métodos apresentam melhor desempenho para os mesmos conjuntos de dados ou
projetos de software. Terceiro, para verificar a precisão de classificação
dos métodos CPDP, foi analisada a qualidade da performance dos método sem
relação à algumas escalas da área sob a curva ROC (ROC-AUC). Quarto, foi
realizada uma análise experimental para verificar quando utilizar a
abordagem proposta. Neste ponto, utilizamos um meta-classificador (árvore
de decisão) que, através de regras de decisão, define quais características
dos dados a abordagem proposta deve ser aplicada e, consequentemente,
apresentar maior desempenho.
Palavras-chave: Predição de Defeitos de Software. Predição de Defeitos
Cruzada entre Projetos. Seleção Dinâmica de Classificadores.
Comentários desativados