Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 2.059
Aluno: Victor Viana de Araújo Silva
Orientadora: Profa. Renata Maria Cardoso Rodrigues de Souza
Coorientador: Prof. Bruno Almeida Pimentel UFAL/Instituto de Computação
Título: Um Método Difuso Multivariado Baseado em Medoids
Data: 15/12/2022
Hora/Local: 16:30 – Virtual – Interessados entrar em contato com o aluno
Banca Examinadora:
Prof. Adriano Lorena Inacio de Oliveira (UFPE / Centro de Informática)
Prof. Getulio José Amorim do Amaral (UFPE / Departamento de Estatística)
Profa. Renata Maria Cardoso Rodrigues de Souza (UFPE / Centro de Informática)
RESUMO:
A Análise de agrupamentos foi inicialmente utilizada por Tyron em 1939, em que visa
organizar dados que possuam características similares dentro de um mesmo grupo e no caso contrário em que os dados possuam características distintas, eles serão alocados em grupos diferentes. Ou seja, se é levado em consideração a ideia de minimizar a distância intra-grupos e maximizar a distância inter-grupos. Com isso, dentre outros benefícios, podem ser visualizadas algumas vantagens da utilização desta técnica, como por exemplo a diminuição da dimensionalidade dos dados e a extração das características dos grupos. O principal método de agrupamento difuso é o Fuzzy C-Means (FCM), o qual possui algumas desvantagens tal como considerar que todos os grupos possuem formas esféricas e ser altamente influenciado em casos de conjuntos de dados ruidosos. O Fuzzy C-medoid (FCMdd) foi criado com o intuito de tentar mitigar esta problemática, porém não leva em consideração o impacto de cada variável no cálculo dos graus de pertinências. Diante desse cenário, o Multivariate Fuzzy C-means (MFCM) foi criado com o intuito de levar em consideração o efeito de cada variável no cálculo dos protótipos, porém, utiliza a média para o cálculo dos centróides podendo ser fortemente influenciado negativamente por dados ruidosos. Este trabalho introduz o método Multivariate Fuzzy C-medoids (MFCMdd), em que como o próprio nome já diz, os graus de pertinência são multivariados e utilizam observações do próprio conjunto de dados para serem os centróides, também conhecidos como medoids. Diante deste cenário, o método proposto MFCMdd, é comparado com os outros três métodos (FCM, FCMdd e MFCM) abordados de acordo com as métricas utilizadas para avaliação dos algoritmos, sendo elas o Índice de Rand Ajustado e o F-score. Com o objetivo de avaliar o desempenho dos métodos, um estudo comparativo em relação aos agrupamentos difusos usando o experimento Monte Carlo é realizado. Além disso,foram planejados experimentos com dados sintéticos e reais. Os resultados mostraram que o método proposto MFCMdd, perante o MFCM é preferível quando se há conjuntos de dados sem ruído ou também quando os conjuntos de dados possuem caráter esférico com dados ruidosos.
Palavras-chave: Análise de Agrupamentos, Fuzzy, Medoids, Multivariado
Comentários desativados