Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 590


Aluno: Johny Moreira da Silva
Orientador: Prof. Luciano de Andrade Barbosa
Título: Augmenting Product Knowledge Graphs with Subjective Information
Data: 02/03/2023
Hora/Local: 14h – Virtual – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Prof. Cleber Zanchettin (UFPE / Centro de Informática)

Prof. Fernando Maciano de Paula Neto  (UFPE / Centro de Informática)
Prof. Altigran Soares da Silva (UFAM / Instituto de Computação)
Prof. José Maria Monteiro (UFC / Departamento de Computação)
Prof. Leandro Balby Marinho (UFCG / Departamento de Sistemas e Computação)


RESUMO
:

Grafos de Produto, do inglês Product Graphs (PGs), são grafos de 
conhecimento com dados sobre produtos de consumo. Atualmente, essas 
estruturas têm se tornado populares devido ao potencial de facilitar 
tarefas de Inteligência Artificial no comércio eletrônico. Os Grafos de 
Produto armazenam dados factuais sobre produtos (ex: smartphones)  e suas 
características (ex: marca, dimensões, e processador) coletados de diversas 
fontes. O enriquecimento dessas estruturas com informações dinâmicas e 
subjetivas, como opiniões de usuários, é essencial para a melhoria das 
tarefas de recomendação, busca, comparação e precificação. No entanto, esta 
é uma nova tarefa e os trabalhos existentes são baseados em abordagens 
supervisionadas. Neste trabalho de tese nós abordamos essa tarefa por meio 
de duas etapas complementares: (1) Nós desenvolvemos uma abordagem 
semi-supervisionada chamada Product Graph enriched with Opinions (PGOpi) 
para enriquecimento de Grafos de Produto com opiniões extraídas de 
avaliações de clientes. Para isso, exploramos um método tradicional de 
mineração de opinião, uma técnica de Supervisão Distante baseada em 
representação de palavras com o objetivo de mitigar a dependência na 
rotulagem manual de dados de treino, e utilizamos Aprendizagem Profunda 
para mapear as opiniões extraídas até os nós do Grafo de Produto; (2) Nós 
construímos um gerador de triplas opinativas chamado SYNthetiC OPinionAted 
TriplEs (SYNCOPATE). Esse gerador pode substituir métodos tradicionais para 
extração pareada de aspectos e opiniões em avaliações de produtos. Para a 
construção do mesmo foi realizado In-Context Learning em um Modelo de 
Linguagem pré-treinado e adaptado. Por último, foi feito o 
pós-processamento do texto gerado, para limpeza e rotulagem automática das 
triplas opinativas. Nós efetuamos a avaliação experimental das duas etapas. 
O PGOpi foi avaliado em cinco categorias de produtos de dois conjuntos de 
dados obtidos de plataformas de comércio eletrônico. O PGOpi alcançou 
valores de micro F1-score superiores a modelos semi-supervisionados mais 
complexos, e também apresentou performance comparável a um modelo de 
estado-da-arte totalmente supervisionado. O SYNCOPATE foi avaliado 
aumentando bases de treino de benchmarking com as triplas opinativas 
geradas sinteticamente. Variações dessas bases de dados rotuladas 
manualmente, geradas sinteticamente e aumentadas foram utilizadas para 
treino de quatro modelos de estado-da-arte de extração pareada de aspectos 
e opiniões. Os resultados obtidos dessa experimentação mostraram que os 
modelos treinados com dados sintéticos apresentaram performance superior 
àqueles treinados em uma pequena porcentagem de dados rotulados e curados 
por humanos. Além disso, três avaliadores humanos realizaram uma inspeção 
manual que atestou a qualidade das triplas geradas sinteticamente.

Palavras-chave: Grafos de Produto. Dados Subjetivos. Mineração de Opinião. 
Modelos de Linguagem. Aprendizagem Zero-shot. Supervisão Distante.

Comentários desativados

Sobre este site

Portal institucional do Centro de Informática – UFPE

Encontre-nos

Endereço
Av. Jornalista Aníbal Fernandes, s/n – Cidade Universitária.
Recife-PE – Brasil
CEP: 50.740-560

Horário
Segunda–Sexta: 8:00–18:00