Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 2.222


Aluno: Luis Vinicius Lauriano de França
Orientador: Prof. Ricardo Bastos Cavalcante Prudencio
Título: Balanceamento de dados para mitigar vieses amostrais e  algorítmicos: um estudo  comparativo
Data: 29/07/2025
Hora/Local: 10h – Virtual – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Profa. Juscimara Gomes Avelino  (UFPE / Centro de Informática)
Prof. Péricles Barbosa Cunha de Miranda (UFRPE / Departamento de Computação )
Prof. Ricardo Bastos Cavalcante Prudêncio (UFPE / Centro de Informática)


RESUMO:

A crescente aplicação de modelos de aprendizado de máquina em decisões de alto impacto social exige uma análise rigorosa de seus potenciais vieses. A justiça algorítmica é um campo de pesquisa fundamental, que frequentemente lida com desafios técnicos como o desbalanceamento de grupos sociais, onde a sub-representação de grupos pode levar a resultados discriminatórios. Técnicas de balanceamento de dados são amplamente utilizadas para melhorar a performance preditiva nesses cenários, mas seu impacto sobre a equidade do modelo é pouco compreendido.

O objetivo deste trabalho foi, portanto, investigar empiricamente o trade-off entre performance preditiva e justiça algorítmica ao aplicar um conjunto de dez técnicas de balanceamento de dados. Para tal, foi conduzido um estudo comparativo de larga escala, avaliando dez abordagens de balanceamento de dados sobre oito bases de dados distintas, com onze algoritmos de classificação. A análise foi realizada sob uma ótica dupla, utilizando medidas para mensurar a performance e um conjunto de cinco métricas de justiça, calculadas com a biblioteca DALEX, para avaliar a justiça.

Os resultados demonstram que a eficácia de cada técnica é altamente dependente do contexto da base de dados. Enquanto técnicas de sobreamostragem, como o SMOTE, frequentemente ofereceram um bom equilíbrio entre ganho de performance e mitigação de viés, abordagens de subamostragem agressiva mostraram-se capazes de degradar a equidade em cenários de desbalanceamento severo, evidenciando um trade-off crítico.

Conclui-se que não existe uma técnica de balanceamento universalmente superior e que a construção de modelos de aprendizado de máquina justos exige uma avaliação conjunta e contextual de múltiplas métricas. Este trabalho contribui com um mapeamento empírico dos efeitos dessas técnicas, oferecendo um guia prático para a seleção de estratégias de mitigação de viés de forma mais consciente e responsável.

Palavras-chave: Aprendizado de Máquina. Justiça Algorítmica. Viés. Balanceamento de Dados. Justiça

Comentários desativados

Sobre este site

Portal institucional do Centro de Informática – UFPE

Encontre-nos

Endereço
Av. Jornalista Aníbal Fernandes, s/n – Cidade Universitária.
Recife-PE – Brasil
CEP: 50.740-560

Horário
Segunda–Sexta: 8:00–18:00