Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 1.949


Aluno: Karina Liseth Ponce Guevara
Orientador:  Prof. Aluizio Fausto Ribeiro Araújo
Título: Mapas Auto-organizáveis para Agrupamento em Subespaços e seu 
Refinamento
Data: 25/02/2021
Hora/Local: 14h00 – Virtual – Interessados em assistir entrar em contato com  a aluna
Banca Examinadora:
Prof. Hansenclever de França Bassani(UFPE / Centro de Informática)
Prof. Ricardo Araújo Rios (UFBA / Departamento de Ciência da Computação)
Prof. Joel Luis Carbonera (UFRGS/Instituto de Informática)

RESUMO:

O agrupamento em subespaços é uma área da aprendizagem de máquina que 
consiste em localizar grupos (clusters) em diferentes subespaços. Parte da 
contribuição deste trabalho é apresentar uma taxonomia de algoritmos de 
agrupamento em subespaços, com uma nova organização baseada em famílias: 
Estatístico-Algébricas, Atribuição de Pesos, Representações de Baixo Posto, 
Métodos Esparsos, Métodos Espectrais e Redes Neurais. Neste trabalho, 
também é realizada uma revalidação dos algoritmos LARFDSSOM e LARFDSSOM2. 
Eles são métodos de agrupamento em subespaços baseados em mapas 
auto-organizáveis com uma estrutura variável no tempo, para agrupar dados 
sem conhecimento prévio do número de categorias ou da topologia da rede 
neural, ambos são determinados durante o processo de treinamento. Estes 
algoritmos apresentam um desempenho competitivo em uma ampla gama de 
contextos como: mineração de dados, expressão gênica, múltiplas vistas, 
visão computacional e agrupamento de texto, estos experimentos incluem 
dados de alta dimensão. Os resultados apresentam um desempenho promissor, 
mesmo assim, eles podem ser melhorados em uma segunda etapa de 
processamento. No agrupamento, nem todas as amostras atribuídas a um grupo 
se encaixam igualmente bem.  Nesse sentido, a proposta deste trabalho é 
utilizar uma abordagem de refinamento Bayesiano para melhorar os resultados 
preliminares. Consequentemente, pretende-se produzir um primeiro resultado 
de agrupamento e em seguida refiná-lo por interações subsequentes, levando 
o modelo a aprender com as probabilidades em suas distribuições nos grupos. 
Também foi empregado um método de Inferência Variacional para os conjuntos 
de dados com uma grande quantidade de amostras, devido a que o cálculo da 
distribuição posteriori dificulta-se devido a que não é possível calculá-lo 
diretamente pelo custo computacional.  Em particular, foi observado que o 
agrupamento pode ser melhorado com uma segunda etapa, e os resultados 
mostram o bom desempenho do algoritmo de refinamento.

Palavras-chave: Agrupamento em Subespaços, Refinamento de Agrupamento, 
Inferência Variacional, Agrupamento de Múltiplas-Vistas, Dados de Alta 
Dimensão, Mapas Auto-Organizáveis.

Comentários desativados