Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 621
Aluno: Francimaria Rayanne dos Santos Nascimento
Orientador: Prof. George Darmiton da Cunha Cavalcanti
Coorientadora: Profa. Márjory Cristiany da Costa Abreu (Sheffield Hallam University )
Título: Hate Speech Detection and Gender Bias Mitigation on Online Social Media
Data: 12/03/2024
Hora/Local: 10h – Virtual – Interessados em assistir entrar em contato com a aluna
Banca Examinadora:
Prof. Tsang Ing Ren (UFPE / Centro de Informática)
Prof. Rafael Menelau Oliveira e Cruz (École de technologie supérieure /Département de génie logiciel et des TI )
Prof. Mirella Moura Moro (UFMG / Departamento de Ciência da Computação)
Prof. Lilian Berton (UNIFESP / Departamento de Ciência e Tecnologia)
Prof. Carolina Scarton (University of Sheffield / Department of Computer Science)
RESUMO:
A popularização das redes sociais online permitiu a rápida proliferação de conteúdos gerados pelos usuários. A grande quantidade de conteúdo gerado a cada segundo nas plataformas de redes sociais torna a moderação adequada do seu conteúdo árdua e demorada, resultando numa fácil disseminação do discurso de ódio. Embora tenham sido feitos avanços significativosna detecção automática de discurso de ódio, preocupações têm surgido a cerca da robustez demodelos de aprendizagem de máquina e o seu impacto devido aos seus comportamentos potencialmente tendenciosos, levando a tendências questionáveis baseadas em termos de identidade (por exemplo, mulheres, negros ou gay). Nesta tese, abordamos o viés não intencional, especificamente o viés de gênero não intencional (unintended gender bias), na tarefa de detecção de discurso de ódio.
No Capítulo 2, é realizado um estudo abrangente do discurso de ódio, incluindo uma análise crítica das definições do termo discurso de ódio propostas em múltiplas plataformas e na comunidade científica. Além disso, é apresentada uma visão geral das principais abordagens geralmente utilizadas na detecção automática de discurso de ódio. Os resultados apresentam uma análise crítica dos recursos teóricos e práticos, discutindo oportunidades nesta área e diversos desafios, incluindo questões como o viés (bias).
No Capítulo 3, é proposta uma nova metodologia que utiliza um multi-view ensemble para a deteção automática de discurso de ódio e a mitigação do viés não intencional de gênero. A metodologia proposta consiste em dois módulos: (1) um módulo de mitigação do viés de gênero baseado na detecção e substituição de palavras sensíveis ao viés e (2) um módulo de detecção de discurso de ódio usando um classificador multi-view stacked. O classificador multi-view stacked combina classificadores básicos treinados com representações de features distintas. Resultados experimentais em quatro conjuntos de dados de benchmark demonstram a eficácia da abordagem proposta em comparação com soluções de última geração, reduzindo o viés não intencional sem comprometer o desempenho do modelo.
Finalmente, no Capítulo 4, é proposta uma estrutura para ajudar a analisar o comportamento tendencioso das técnicas de extração de características. Além disso, foi projetado um novo conjunto de dados abrangente para ajudar na avaliação do viés de gênero não intencional, denominado Unbiased dataset. Conduzimos um estudo experimental sobre vários métodos de extração de recursos de última geração, com foco em seu potencial viés em relação aos termos de identidade. Nossas descobertas indicam que a técnica de extração de características pode influenciar o viés encontrado no modelo final, e sua eficácia pode depender do conjunto de dados analisado.
Palavras-chave: Detecção de discurso de ódio. Ensemble learning. Viés de gênero. Multi-view. Redes sociais.
Comentários desativados