Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº
1.955

Aluno: Luiz Delando Santos Moreira Júnior
Orientador: Prof. Giordano Ribeiro Eulálio Cabral
Título: Comparando Predição de Popularidade de Podcast a Partir de 
Metadados, Conteúdo e Características de Áudio
Data: 09/03/2021
Hora/Local: 14h – Virtual
Banca Examinadora:
Prof. Geber Lisboa Ramalho  (UFPE / Centro de Informática)
Prof. Tiago Fernandes Tavares  (UNICAMP / Engenharia Elétrica e de Computação)
Prof. Giordano Ribeiro Eulalio Cabral  (UFPE / Centro de Informática)

RESUMO:

Podcasts são uma forma relativamente nova de conteúdo, que vem ganhando 
cada vez mais popularidade no cenário nacional e mundial. Por exemplo, a 
Spotify introduziu os podcasts em seu aplicativo e investiu 340 milhões de 
dólares na compra de produtoras como a Gimlet e a Anchor. Além disso, em 
2019, o grupo Globo lançou diversos dos seus programas e telejornais nesse 
novo formato, feito para o público ouvir quando e onde quiser. Mas, criar 
podcasts não é uma particularidade desses grandes grupos. Devido à 
facilidade no processo de produção e publicação, produtores independentes 
também ocupam uma fatia desse mercado, fazendo com que exista um grande 
volume de conteúdo sendo produzido diariamente. Segundo a Whitner, em 2020 
foi alcançada a marca de 1 milhão de canais ativos e mais de 30 milhões de 
episódios publicados. Identificar quais são os podcasts com mais chances de 
sucesso é uma atividade não trivial e extremamente importante, pois essa 
informação pode ser usada para modificar a forma com que os episódios são 
exibidos nos aplicativos ou definir investimentos a serem realizados, por 
exemplo. O objetivo principal deste trabalho é identificar quais 
características apresentam melhor desempenho na predição da popularidade 
dos episódios. Para isso, construímos uma base com mais de 800 episódios, 
totalizando mais de 600 horas de podcasts transcritos. Então, comparamos a 
predição de popularidade dos podcasts utilizando diversas estratégias de 
aprendizagem de máquina, bem como características de áudio, do conteúdo 
falado e dos metadados disponíveis no RSS Feed de cada canal. Estes últimos 
são utilizados pelos próprios produtores para inserir informações 
relevantes sobre o podcast.

Palavras-chave: Podcast; Aprendizado de Máquina; Processamento de Texto; 
Processamento de Áudio; Predição de Popularidade; Seleção de 
Características;

Comentários desativados