Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 642
Aluno: Filipe Coelho de Lima Duarte
Orientador: Prof. Paulo Salgado Gomes de Mattos Neto
Coorientador: Prof. Paulo Renato Alves Firmino (UFCA)
Título: Um sistema híbrido baseado em combinação de preditores para
previsão de vários passos à frente de séries temporais de taxas de
mortalidade
Data: 06/09/2024
Hora/Local: 9h – Virtual – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Prof. Leandro Maciel Almeida (UFPE / Centro de Informática)
Prof. João Fausto Lorenzato de Oliveira (UPE / Escola Politécnica de Pernambuco)
Prof. Jorge Miguel Bravo (Universidade Nova de Lisboa / Information Management School)
Prof. Leonardo Nogueira Matos (UFS / Departamento de Computação)
Prof. Fernando Luiz Cyrino Oliveira (PUC-RJ / Departamento de Engenharia Industrial)
RESUMO:
Prever taxas de mortalidade para múltiplos passos à frente é essencial em áreas como demografia, seguros e políticas públicas. Os trabalhos de previsão de taxas de mortalidade com múltiplos passos à frente supõem que seus resíduos, obtidos pela diferença entre a série temporal e suas previsões, refletem erros aleatórios e linearmente descorrelacionados no tempo. No entanto, problemas como má-especificação (i.e., sobreajustes e subajustes) ou o comportamento dinâmico do fenômeno temporal conduzem a modelos viesados ou imprecisos, deixando padrões nos resíduos ainda não modelados. Adicionalmente, prever múltiplos passos à frente em séries temporais curtas intensifica o desafio. Levando em conta essa problemática, esta tese propõe um novo sistema híbrido para a previsão de taxas de mortalidade em vários passos à frente. O sistema proposto é composto de três etapas: (i) um modelo estatístico linear é usado para prever séries temporais de taxas de mortalidade; (ii) um modelo de Aprendizado de Máquina (AM) é empregado para prever os padrões não-lineares dos resíduos de (i); e (iii) as estimativas da série e dos resíduos são combinadas por uma soma simples. Para cada conjunto de dados, o sistema seleciona em um pool de modelos de AM o mais promissor para prever os resíduos. O desempenho de previsão do sistema proposto foi avaliado por meio de uma análise experimental, a qual considerou quinze conjuntos de dados disponíveis na Human Mortality Database (HMD). Esses conjuntos de dados englobaram as taxas de mortalidade da população total, masculina e feminina de cinco países: Austrália, Estados Unidos, França, Japão e Portugal, considerando cento e uma faixas etárias, desde o nascimento até os 100 anos de idade. A proposta utilizou o modelo Autorregressivo Integrado de Médias Móveis para prever as séries das taxas de mortalidade e empregou um pool dos modelos Perceptron de Multicamadas (MLP), Long Short-Term Memory (LSTM) e Neural basis expansion analysis for interpretable time series (N-BEATS) para prever os resíduos do preditor linear. O sistema proposto foi comparado com alternativas da literatura, entre técnicas estatísticas tradicionais, modelos de AM e sistemas híbridos, utilizando Mean Absolute Percentage Error (MAPE) e Mean Absolute Scaled Error (MASE) como métricas de desempenho preditivo. Diante disso, o sistema proposto alcançou uma média menor que 1,875% e 1,516 para o MAPE e MASE, respectivamente considerando todos os conjuntos de dados para dez horizontes de previsão. Ainda, os resultados sugerem que a proposta é promissora, alcançando a melhor acurácia de previsão dentre todas as alternativas consideradas, especificamente para o teste Nemenyi Multiple comparisons with the best (MCB), onde o sistema proposto apresentou o melhor desempenho dentre as alternativas.
Palavras-chave: Sistemas híbridos. Redes neurais artificiais. Aprendizado profundo. Previsão de múltiplos passos à frente. Previsão de mortalidade.
Comentários desativados