Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 1.955
Aluno: Luiz Delando Santos Moreira Júnior
Orientador: Prof. Giordano Ribeiro Eulálio Cabral
Título: Comparando Predição de Popularidade de Podcast a Partir de
Metadados, Conteúdo e Características de Áudio
Data: 09/03/2021
Hora/Local: 14h – Virtual
Banca Examinadora:
Prof. Geber Lisboa Ramalho (UFPE / Centro de Informática)
Prof. Tiago Fernandes Tavares (UNICAMP / Engenharia Elétrica e de Computação)
Prof. Giordano Ribeiro Eulalio Cabral (UFPE / Centro de Informática)
RESUMO:
Podcasts são uma forma relativamente nova de conteúdo, que vem ganhando
cada vez mais popularidade no cenário nacional e mundial. Por exemplo, a
Spotify introduziu os podcasts em seu aplicativo e investiu 340 milhões de
dólares na compra de produtoras como a Gimlet e a Anchor. Além disso, em
2019, o grupo Globo lançou diversos dos seus programas e telejornais nesse
novo formato, feito para o público ouvir quando e onde quiser. Mas, criar
podcasts não é uma particularidade desses grandes grupos. Devido à
facilidade no processo de produção e publicação, produtores independentes
também ocupam uma fatia desse mercado, fazendo com que exista um grande
volume de conteúdo sendo produzido diariamente. Segundo a Whitner, em 2020
foi alcançada a marca de 1 milhão de canais ativos e mais de 30 milhões de
episódios publicados. Identificar quais são os podcasts com mais chances de
sucesso é uma atividade não trivial e extremamente importante, pois essa
informação pode ser usada para modificar a forma com que os episódios são
exibidos nos aplicativos ou definir investimentos a serem realizados, por
exemplo. O objetivo principal deste trabalho é identificar quais
características apresentam melhor desempenho na predição da popularidade
dos episódios. Para isso, construímos uma base com mais de 800 episódios,
totalizando mais de 600 horas de podcasts transcritos. Então, comparamos a
predição de popularidade dos podcasts utilizando diversas estratégias de
aprendizagem de máquina, bem como características de áudio, do conteúdo
falado e dos metadados disponíveis no RSS Feed de cada canal. Estes últimos
são utilizados pelos próprios produtores para inserir informações
relevantes sobre o podcast.
Palavras-chave: Podcast; Aprendizado de Máquina; Processamento de Texto;
Processamento de Áudio; Predição de Popularidade; Seleção de
Características;
Comentários desativados