Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 545
Aluna: Dailys Maite Aliaga Reyes
Orientador: Prof. Adriano Lorena Inácio de Oliveira
Co-orientadora: Profa. Renata Maria Cardoso Rodrigues de Souza
Título: Predição para Dados Simbólicos Multi-valorados de Tipo Quartis:
Caso Especial Dados Representados por Boxplots
Data: 23/02/2022
Hora/Local: 14h – Virtual – Interessados em assistir entrar em contato com a aluna
Banca Examinadora:
Prof. Nivan Roberto Ferreira Júnior (UFPE / Centro de Informática)
Prof. Paulo Salgado Gomes de Mattos Neto (UFPE / Centro de Informática)
Prof. Francisco Cribari Neto (UFPE / Departamento de Estatística)
Prof. Telmo de Menezes e Silva Filho (University of Bristol )
Prof. Leandro Carlos de Souza(UFPB / Departamento de Informática)
RESUMO:
Um dado simbólico de tipo 𝑏𝑜𝑥𝑝𝑙𝑜𝑡 pode ser considerado como um caso particular das
variáveis numéricas multi-valoradas no contexto da Análises de Dados Simbólicos (ADS). Este tipo de dado tem uma estrutura simples que permite resumir informações de unidades agregadas, chamadas de classes. No entanto, esse tipo de estrutura tem sido pouco explorada na literatura de ADS. Este trabalho apresenta duas novas abordagens de predição com o objetivo de extrair conhecimento e fazer inferência usando dados de 𝑏𝑜𝑥𝑝𝑙𝑜𝑡. A primeira abordagem considera um modelo de regressão para 𝑏𝑜𝑥𝑝𝑙𝑜𝑡 através da equação paramétrica da reta. Esta parametrização permite o ajuste dos pontos nas variáveis regressoras que permite melhorar a qualidade da variável resposta. Nessa direção, um critério é também proposto para verificar a coerência matemática da predição. Se a coerência não é garantida, uma nova estratégia, através de transformações 𝐵𝑜𝑥 −𝐶𝑜𝑥 é aplicada sobre a variável resposta de tipo 𝑏𝑜𝑥𝑝𝑙𝑜𝑡. A segunda abordagem proposta nesse trabalho consiste de um modelo que combina agregação, seleção de protótipos e previsão de series temporais. Inicialmente, as séries temporais são agregadas em classes de entidades e representadas por 𝑏𝑜𝑥𝑝𝑙𝑜𝑡𝑠. Um processo de seleção de protótipos baseado na informação mútua é aplicado para mitigar ruídos no conjunto de dados. Por último, um modelo multivariado para previsão de 𝑏𝑜𝑥𝑝𝑙𝑜𝑡𝑠 é construído. Ambos modelos são avaliados com conjuntos de dados sintéticos e reais. Uma comparação entre as
abordagens propostas e outros métodos de predição da literatura de ADS é também descrita. Além disso, este trabalho apresenta uma aplicação do mundo real no Setor Elétrico Brasileiro para fazer predição da temperatura dos motores usando a abordagem de regressão paramétrica para dados de 𝑏𝑜𝑥𝑝𝑙𝑜𝑡.
Palavras-chave: Análise de dados simbólicos. Boxplots. Seleção de
protótipos. Informação mútua. Múltiplas séries temporais. Modelo vetorial
autorregressivo. Regressão linear. Funções de quartis.
Comentários desativados