Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 2.078


Aluno: Gabriel Harrison Fidelis Teotonio
Orientadora: Profa. Renata Maria Cardoso Rodrigues de Souza
Coorientador: Prof.  Getúlio José Amorim do Amaral (UFPE/Deptº de Estatística)
Título: Variable Weighted Fuzzy Clustering Algorithm For Qualitative Data
Data: 25/05/2023
Hora/Local: 14h – Virtual – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Prof. Nivan Roberto Ferreira Júnior (UFPE / Centro de Informática)
Prof. Bruno Almeida Pimentel (UFAL / Instituto de Computação)
Profa. Renata Maria Cardoso Rodrigues de Souza (UFPE / Centro de Informática)


RESUMO:

Este trabalho se concentra nos métodos de agrupamento dentro do aprendizado não supervisionado, uma subdivisão desafiadora da aprendizagem de máquina. O agrupamento é uma técnica para encontrar subgrupos em um conjunto de dados, onde as observações em cada grupo são semelhantes umas às outras e diferentes das observações em outros grupos. Os métodos de agrupamento existentes lidam com variáveis quantitativas, com o método K-Means sendo o mais conhecido e amplamente utilizado. No entanto, o algoritmo
K-Means não pode ser usado com variáveis qualitativas, como gênero ou nível de educação.
Para superar esta limitação, foi proposto o método K-Modes, que usa modos em vez de
médias para representar as classes. Os algoritmos de agrupamento existentes têm a limitação de atribuir importância igual a todas as características, o que pode ser problemático ao agrupar dados de alta dimensão e esparsos, onde a estrutura do agrupamento é limitada a um subconjunto específico de características. Para abordar este problema, foram propostas técnicas de agrupamento de subespaço e distâncias adaptativas, sendo estas últimas derivadas a partir de restrições baseadas na soma e no produto dos pesos relativos à importância das variáveis. O estudo propõe um novo algoritmo de agrupamento difuso para dados qualitativos baseado em distâncias adaptativas, o qual demonstra desempenho melhorado em comparação aos métodos convencionais. As distâncias adaptativas locais, que atribuem pesos diferentes para cada variável em relação aos agrupamentos, apresentam melhor desempenho para conjuntos de dados com altos níveis de dispersão e sobreposição de classes. Os resultados do estudo ampliam as capacidades dos algoritmos de agrupamento existentes baseados em distâncias adaptativas.


Palavras-chave: Agrupamento; Aprendizado não supervisionado; Distâncias 
adaptativas; Dados qualitativos

Comentários desativados

Sobre este site

Portal institucional do Centro de Informática – UFPE

Encontre-nos

Endereço
Av. Jornalista Aníbal Fernandes, s/n – Cidade Universitária.
Recife-PE – Brasil
CEP: 50.740-560

Horário
Segunda–Sexta: 8:00–18:00