Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 1.927
Aluno: Rafaella Ferreira do Vale
Orientador: Prof. Rafael Dueire Lins
Título: Análise Comparativa de Métodos de Simplificação de Sentenças para
Sumarização Extrativa de Textos
Data: 28/09/2020
Hora/Local: 14h – Virtual – https://meet.google.com/zuz-voiv-gmy
Banca Examinadora:
Prof. Frederico Luiz Gonçalves de Freitas (UFPE / Centro de Informática)
Prof. Rafael Ferreira Leite de Mello (UFRPE / Departamento de Computação)
Prof. Rafael Dueire Lins (UFPE / Centro de Informática)
RESUMO:
A manipulação de grandes volumes de textos digitais traz inúmeros desafios que, para serem mitigados, requerem forte dependência humana de abordagens automáticas. Com o crescimento sem precedentes de conteúdo textual na Web, técnicas voltadas para o processamento automático ou com o mínimo esforço humano necessário são essenciais. A sumarização automática de textos é uma dessas técnicas, sendo aplicável na coleção de conteúdo relevante nesse contexto. A sumarização extrativa, em particular, seleciona um conjunto de sentenças de um texto com base em critérios específicos. Estratégias para sumarização extrativa podem se beneficiar de técnicas de pré-processamento que enfatizam a relevância ou informatividade das sentenças em relação a critérios de seleção. Nesta pesquisa, essa hipótese é testada com métodos de simplificação de sentenças. Quatro métodos são utilizados para simplificar um corpus de notícias em língua inglesa do CNN: um método baseado em regras, um de otimização, um modelo de rede profunda supervisionado e um modelo de rede profunda não supervisionado. Os textos simplificados são sumarizados usando 14 estratégias de seleção de sentenças. As combinações de métodos de simplificação e sumarização são comparadas com o baseline — o corpus sumarizado sem simplificação prévia — em análise quantitativa, a qual sugere que a compressão de sentenças com restrições e modelos que aprendem de grandes corpora de pares de sentenças tendem a Desempenhar melhor e a trazer ganhos em relação à não aplicação de simplificação precedente.
Palavras-chave: Processamento de linguagem natural. Simplificação de
sentenças. Sumarização extrativa de textos.
Comentários desativados