Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 1.949
Aluno: Karina Liseth Ponce Guevara
Orientador: Prof. Aluizio Fausto Ribeiro Araújo
Título: Mapas Auto-organizáveis para Agrupamento em Subespaços e seu
Refinamento
Data: 25/02/2021
Hora/Local: 14h00 – Virtual – Interessados em assistir entrar em contato com a aluna
Banca Examinadora:
Prof. Hansenclever de França Bassani(UFPE / Centro de Informática)
Prof. Ricardo Araújo Rios (UFBA / Departamento de Ciência da Computação)
Prof. Joel Luis Carbonera (UFRGS/Instituto de Informática)
RESUMO:
O agrupamento em subespaços é uma área da aprendizagem de máquina que
consiste em localizar grupos (clusters) em diferentes subespaços. Parte da
contribuição deste trabalho é apresentar uma taxonomia de algoritmos de
agrupamento em subespaços, com uma nova organização baseada em famílias:
Estatístico-Algébricas, Atribuição de Pesos, Representações de Baixo Posto,
Métodos Esparsos, Métodos Espectrais e Redes Neurais. Neste trabalho,
também é realizada uma revalidação dos algoritmos LARFDSSOM e LARFDSSOM2.
Eles são métodos de agrupamento em subespaços baseados em mapas
auto-organizáveis com uma estrutura variável no tempo, para agrupar dados
sem conhecimento prévio do número de categorias ou da topologia da rede
neural, ambos são determinados durante o processo de treinamento. Estes
algoritmos apresentam um desempenho competitivo em uma ampla gama de
contextos como: mineração de dados, expressão gênica, múltiplas vistas,
visão computacional e agrupamento de texto, estos experimentos incluem
dados de alta dimensão. Os resultados apresentam um desempenho promissor,
mesmo assim, eles podem ser melhorados em uma segunda etapa de
processamento. No agrupamento, nem todas as amostras atribuídas a um grupo
se encaixam igualmente bem. Nesse sentido, a proposta deste trabalho é
utilizar uma abordagem de refinamento Bayesiano para melhorar os resultados
preliminares. Consequentemente, pretende-se produzir um primeiro resultado
de agrupamento e em seguida refiná-lo por interações subsequentes, levando
o modelo a aprender com as probabilidades em suas distribuições nos grupos.
Também foi empregado um método de Inferência Variacional para os conjuntos
de dados com uma grande quantidade de amostras, devido a que o cálculo da
distribuição posteriori dificulta-se devido a que não é possível calculá-lo
diretamente pelo custo computacional. Em particular, foi observado que o
agrupamento pode ser melhorado com uma segunda etapa, e os resultados
mostram o bom desempenho do algoritmo de refinamento.
Palavras-chave: Agrupamento em Subespaços, Refinamento de Agrupamento,
Inferência Variacional, Agrupamento de Múltiplas-Vistas, Dados de Alta
Dimensão, Mapas Auto-Organizáveis.
Comentários desativados