Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 625

Aluno: Rogério Luiz Cardoso Silva Filho
Orientador: Prof. Paulo Jorge Leitão Adeodato
Coorientador: Prof. Kellyton Brito Soares (UFRPE/DC)
Título: Isolating Feature Impacts in Educational Data Mining: Novel Metrics and Insights from Accumulated Local Effects
Data: 18/04/2024
Hora/Local: 9h – Virtual – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Prof. Ricardo Bastos Cavalcante Prudêncio (UFPE / Centro de Informática)
Prof. Alex Sandro Gomes (UFPE / Centro de Informática)
Prof. Martin Carnoy (Stanford University )
Prof. Karla Patricia Santos Oliveira Rodríguez Esquerre (UFBA / Depto de Eng. Química)
Prof. Bruno Campello de Souza (UFPE / Departamento de Ciências Econômicas)

RESUMO:

Esta tese apresenta um estudo na interseção entre Aprendizado de Máquina (ML) e educação, enfatizando a aplicação de técnicas de Inteligência Artificial Explicável (IAE) em Mineração de Dados Educacionais (MDE). Central para esta pesquisa é o desafio de fornecer explicações globais post hoc para modelos de ML, especialmente quando a independência dos dados não pode ser assumida, uma questão comum, porém pouco explorada, em MDE. Ignorar interdependências de dados pode enviesar explicações, inflar variáveis irrelevantes ou atribuir desproporcionalmente significância a certos preditores. Para resolver esses desafios, a tese baseia-se em um método recente para a visualização do impacto das variáveis em modelos supervisionados, conhecido em inglês como Accumulated Local Effects (ALE), que se refere à distribuição acumulada de efeitos locais. A propriedade pseudo-ortogonal de ALE permite isolar os efeitos de variáveis individuais, distinguindo-a de métodos amplamente usados em MDE, como os gráficos de dependência parcial e explicações baseadas em valores de Shapley. Para demonstrar as propriedades de ALE quando comparados com métodos tradicionais, este trabalho introduz uma nova metodologia para avaliação da capacidade de técnicas de IAE em aproximar o real comportamento de variáveis em diversos contextos de dependência entre dados. Além disso, este trabalho propõe novas métricas baseadas em ALE para a medição do impacto de variáveis em modelos supervisionados. Essas métricas agnósticas a modelos são uma melhoria em relação às técnicas tradicionais, fornecendo percepções mais claras e precisas de como as variáveis afetam os resultados do modelo, incluindo tanto a extensão quanto a direção de seus impactos. A eficácia dessas métricas é demonstrada em conjuntos de dados sintéticos e reais, provando sua efetividade em isolar os efeitos de variáveis relevantes para as predições dos modelos quando comparada com métricas existentes. Além disso, um estudo empírico utilizando os dados das escolas secundárias brasileiras não apenas ratifica a utilidade das novas métricas em cenários do mundo real, mas também estende as contribuições desta tese ao identificar e oferecer novas perspectivas sobre os determinantes do sucesso escolar brasileiro ao longo de uma década.

Palavras-chave: IA explicável. Aprendizagem de máquina interpretável. Explicadores globais. Mineração de dados educacionais. Importância de variáveis. ALE

Comentários desativados

Sobre este site

Portal institucional do Centro de Informática – UFPE

Encontre-nos

Endereço
Av. Jornalista Aníbal Fernandes, s/n – Cidade Universitária.
Recife-PE – Brasil
CEP: 50.740-560

Horário
Segunda–Sexta: 8:00–18:00