Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 567
Aluno: Rogério César Peixoto Fragoso
Orientador: Prof. George Darmiton da Cunha Cavalcanti
Co-orientador: Prof. Roberto Hugo Wanderley Pinheiro (UFCA)
Título: Clustering-based Dynamic Ensemble Selection for One-Class
Decomposition
Data: 24/08/2022
Hora/Local: 14h – Virtual – interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Prof. Adriano Lorena Inacio de Oliveira (UFPE / Centro de Informática)
Prof. Yandre Maldonado e Gomes da Costa (UEMA / Departamento de Informática)
Prof. Renato Vimieiro (UFMG / Departamento de Ciência da Computação)
Prof. George Gomes Cabral (UFRPE / Departamento de Estatística e Informática)
Prof. Péricles Barbosa Cunha de Miranda (UFRPE / Departamento de Computação)
RESUMO:
Uma solução natural para lidar com problemas multiclasse é empregar classificadores multiclasse. No entanto, em situações específicas, como dados desbalanceados ou grande número de classes, é mais eficaz decompor o problema multiclasse em vários problemas mais fáceis de resolver. A decomposição em uma classe é uma alternativa, onde classificadores de uma classe (OCCs) são treinados para cada classe separadamente. No entanto, ajustar os dados de forma otimizada é um desafio para OCCs, principalmente quando os dados apresentam uma distribuição intraclasse complexa. A literatura mostra que sistemas de múltiplos classificadores são inerentemente robustos em tais casos. Assim, a adoção de múltiplos OCCs para cada classe pode levar a uma melhoria na decomposição de uma classe. Com isso em mente, neste trabalho apresentamos dois métodos para classificação de problemas multiclasse através ensembles de OCCs. One-class Classifier Dynamic Ensemble Selection for Multi-class problems (MODES, para abreviar) e Density-Based Dynamic Ensemble Selection (DBDES) fornecem classificadores competentes para cada região do espaço de características, decompondo o problema multiclasse original em vários problemas de uma classe. Assim, cada classe é segmentada e um OCC é treinado para cada cluster. MODES utiliza o algoritmo K-means e um conjunto de índices de validação de cluster enquanto DBDES utiliza o algoritmo OPTICS para a segmentação dos dados. A lógica é reduzir a complexidade da tarefa de classificação definindo uma região do espaço de características onde o classificador deve ser um especialista. A classificação de um exemplo de teste é realizada selecionando dinamicamente um conjunto de OCCs competentes e a decisão final é dada pela reconstrução do problema multiclasse original. Experimentos realizados com 25 bancos de dados, 4 modelos OCC e 3 métodos de agregação mostraram que as técnicas propostas superam a literatura. Quando comparado com o estado da arte, MODES e DBDES obtiveram melhores resultados, principalmente para bancos de dados com regiões de decisão complexas.
Palavras-chave: Decomposição de uma classe. Sistemas de Múltiplos Classificadores. Seleção Dinâmica de Ensemble.
Comentários desativados