Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 2.090
Aluna: Sara Bandeira Coutinho
Orientador: Prof. George Darmiton da Cunha Cavalcanti
Coorientador: Prof. Rafael Menelau Oliveira e Cruz (École de Technologie Supérieure / Département de génie logiciel et des TI )
Título: Seleção de ensemble heterogêneo para a detecção de Fake News
Data: 02/08/2023
Hora/Local: 15h – Virtual – Interessados em assistir entrar em contato com a aluna
Banca Examinadora:
Prof. Adiel Teixeira de Almeida Filho (UFPE / Centro de Informática)
Profa. Ellen Polliana Ramos Souza (UFRPE / Unidade Acadêmica de Serra Talhada)
Prof. George Darmiton da Cunha Cavalcanti (UFPE / Centro de Informática)
RESUMO:
A disseminação de Fake News tornou-se um dos problemas da sociedade atual.
Uma solução para esse problema é detectar a veracidade dos textos das
notícias usando sistemas automatizados dada a existência de uma dificuldade
intrínseca ao ser humano de detectá-las, concernente ao viés de
confirmação, bem como a grande quantidade de dados gerados online, que
inviabiliza uma inspeção manual. Diversas abordagens relacionadas ao
aprendizado de máquina têm sido propostas na literatura. Dentre elas, o uso
de sistemas de múltiplos classificadores mostrou-se promissor por obter
resultados melhores do que sistemas que usam apenas um classificador. No
entanto, para serem eficientes, esses sistemas precisam de que seus
classificadores sejam diversos, e essa diversidade pode ser obtida usando
classificadores heterogêneos, assim como pode ser verificada por meio de
uma análise sob diferentes níveis de dissimilaridade entre os
classificadores. Assim, este trabalho propõe um sistema de múltiplos
classificadores que seleciona um subconjunto de um pool de classificadores
heterogêneos. Deseja-se que os classificadores selecionados sejam diversos
e, para esse fim, cada classificador no pool é representado usando a medida
de diversidade e um algoritmo de agrupamento hierárquico, que agrupa os
classificadores semelhantes, facilitando a seleção dos classificadores mais
diversos. Em complemento, para esta etapa, considerou-se escolhê-los a
partir daqueles que apresentaram um maior desempenho, em uma análise
individual, nas métricas de avaliação, a fim de que fosse obtido o
subconjunto com maior diversidade e com classificadores que tiveram uma
maior capacidade de generalização. Nos experimentos foram considerados seis
conjuntos de dados, de diferentes contextos e quantidades de classe. O
método foi comparado com outras três heurísticas de seleção e com
abordagens da literatura. As métricas adotadas para avaliar os resultados
foram acurácia, precisão, revocação e medida f1. O método apresentou
resultados promissores, alcançando o maior desempenho, com relação aos
demais, em 3 dos 6 conjuntos adotados, os quais apresentaram apenas duas
classes.
Palavras-chave: Detecção de Fake News. Sistema de múltiplos
classificadores. Diversidade. Agrupamento hierárquico.
Comentários desativados