Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 590
Aluno: Johny Moreira da Silva
Orientador: Prof. Luciano de Andrade Barbosa
Título: Augmenting Product Knowledge Graphs with Subjective Information
Data: 02/03/2023
Hora/Local: 14h – Virtual – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Prof. Cleber Zanchettin (UFPE / Centro de Informática)
Prof. Fernando Maciano de Paula Neto (UFPE / Centro de Informática)
Prof. Altigran Soares da Silva (UFAM / Instituto de Computação)
Prof. José Maria Monteiro (UFC / Departamento de Computação)
Prof. Leandro Balby Marinho (UFCG / Departamento de Sistemas e Computação)
RESUMO:
Grafos de Produto, do inglês Product Graphs (PGs), são grafos de
conhecimento com dados sobre produtos de consumo. Atualmente, essas
estruturas têm se tornado populares devido ao potencial de facilitar
tarefas de Inteligência Artificial no comércio eletrônico. Os Grafos de
Produto armazenam dados factuais sobre produtos (ex: smartphones) e suas
características (ex: marca, dimensões, e processador) coletados de diversas
fontes. O enriquecimento dessas estruturas com informações dinâmicas e
subjetivas, como opiniões de usuários, é essencial para a melhoria das
tarefas de recomendação, busca, comparação e precificação. No entanto, esta
é uma nova tarefa e os trabalhos existentes são baseados em abordagens
supervisionadas. Neste trabalho de tese nós abordamos essa tarefa por meio
de duas etapas complementares: (1) Nós desenvolvemos uma abordagem
semi-supervisionada chamada Product Graph enriched with Opinions (PGOpi)
para enriquecimento de Grafos de Produto com opiniões extraídas de
avaliações de clientes. Para isso, exploramos um método tradicional de
mineração de opinião, uma técnica de Supervisão Distante baseada em
representação de palavras com o objetivo de mitigar a dependência na
rotulagem manual de dados de treino, e utilizamos Aprendizagem Profunda
para mapear as opiniões extraídas até os nós do Grafo de Produto; (2) Nós
construímos um gerador de triplas opinativas chamado SYNthetiC OPinionAted
TriplEs (SYNCOPATE). Esse gerador pode substituir métodos tradicionais para
extração pareada de aspectos e opiniões em avaliações de produtos. Para a
construção do mesmo foi realizado In-Context Learning em um Modelo de
Linguagem pré-treinado e adaptado. Por último, foi feito o
pós-processamento do texto gerado, para limpeza e rotulagem automática das
triplas opinativas. Nós efetuamos a avaliação experimental das duas etapas.
O PGOpi foi avaliado em cinco categorias de produtos de dois conjuntos de
dados obtidos de plataformas de comércio eletrônico. O PGOpi alcançou
valores de micro F1-score superiores a modelos semi-supervisionados mais
complexos, e também apresentou performance comparável a um modelo de
estado-da-arte totalmente supervisionado. O SYNCOPATE foi avaliado
aumentando bases de treino de benchmarking com as triplas opinativas
geradas sinteticamente. Variações dessas bases de dados rotuladas
manualmente, geradas sinteticamente e aumentadas foram utilizadas para
treino de quatro modelos de estado-da-arte de extração pareada de aspectos
e opiniões. Os resultados obtidos dessa experimentação mostraram que os
modelos treinados com dados sintéticos apresentaram performance superior
àqueles treinados em uma pequena porcentagem de dados rotulados e curados
por humanos. Além disso, três avaliadores humanos realizaram uma inspeção
manual que atestou a qualidade das triplas geradas sinteticamente.
Palavras-chave: Grafos de Produto. Dados Subjetivos. Mineração de Opinião.
Modelos de Linguagem. Aprendizagem Zero-shot. Supervisão Distante.
Comentários desativados