Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 546

Aluno: Gustavo Henrique Ferreira de Miranda Oliveira
Orientador: Prof. Adriano Lorena Inácio de Oliveira
Co-orientador: Prof. Leandro Lei Minku (School of Computer Science)
Título: TACKLING VIRTUAL AND REAL CONCEPT DRIFTS VIA ADAPTIVE GAUSSIAN MIXTURE MODEL APPROACHES
Data: 24/02/2022
Hora/Local: 13h – Virtual – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Profa. Teresa Bernarda Ludermir (UFPE / Centro de Informática)

Prof. Francisco de Assis Tenório de Carvalho (UFPE / Centro de Informática)
Prof. George Darmiton da Cunha Cavalcanti (UFPE / Centro de Informática)
Prof. Luiz Eduardo Soares Oliveira  (UFPA / Departamento de Informática)
Prof. João Gama  (University of Porto, Portugal / Laboratory of Artificial 
Intelligence and Decision Support, and Faculty of Economics)


RESUMO:

As aplicações do mundo real têm lidado com uma grande quantidade de informações, que chegam de forma contínua e sequencialmente ao longo do tempo, caracterizadas como fluxos de dados. Esse tipo de dado desafia os algoritmos de aprendizado de máquina devido à mudança de conceito. A mudança de conceito é uma mudança na distribuição de probabilidade conjunta do problema e tem duas variações: a mudança virtual que afeta a distribuição de probabilidade incondicional p(x); e a mudança real que afeta a distribuição de probabilidade condicional p(y|x). Essas mudanças podem ocorrer separadamente e simultaneamente e ter impactos diferentes no desempenho do classificador. Os trabalhos da literatura geralmente não compreendem bem esses aspectos. Devido a isso, se concentram apenas nas mudanças reais, por que elas causam degradação direta no desempenho do classificador. No entanto, desvios virtuais também podem causar essa degradação de forma indireta. Novas observações podem chegar em uma região não treinada pelo classificador, forçando-o a confundir sua verdadeira classe, assim cometendo erros de classificação. O ideal seria ter classificadores que entendam que tipo de mudança ocorre em determinado momento para ativar estratégias apropriadas para lidar com este desafio. Este processo é chamado de entendimento da mudança. Como as abordagens da literatura não compreendem bem os diferentes impactos causados pelas mudanças virtuais e reais, o seu desempenho fica limitado. Motivados por isso, propomos três abordagens para entender o tipo da mudança e usar a estratégia correta para se adaptar, sendo elas: (i) (GMM-VRD) Gaussian Mixture Model For Dealing With Virtual and Real Concept Drifts; (ii) (OGMMF-VRD) On-line Gaussian Mixture Model With Noise Filter For Handling Virtual And Real Concept Drifts ; e (iii) (GLDD-DU) Gaussian Local Drift Detector for Drift Understanding. Essas abordagens atualizam e criam Gaussians on-line para lidar com mudanças virtuais, usam detectores de mudança para reinicializar o conhecimento do sistema para lidar com mudanças reais e recuperam modelos do pool para acelerar a adaptação a um novo conceito. Os principais resultados mostraram que todas as abordagens apresentam desempenho competitivo, mas o OGMMF-VRD foi mais consistente ao longo dos conjuntos de dados, apresentando melhor desempenho.


Palavras-chave: Modelo de Mistura Gaussiana, Fluxos de Dados, Mudança de Conceito Virtual, Mudança de Conceito Real, Entendimento da Mudança.

Comentários desativados