Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 2.122
Aluno: Maira Farias de Andrade Lira
Orientador: Prof. Ricardo Bastos Cavalcante Prudêncio
Título: Abordagens para Seleção de Limiares de Decisão e Filtros de Suavização em Detecção de Anomalias
Data: 25/01/2023
Hora/Local: 14h – Virtual – Interessados em assistir entrar em contato com a aluna
Banca Examinadora:
Prof. Paulo Salgado Gomes de Mattos Neto (UFPE / Centro de Informática)
Prof. João Paulo Pordeus Gomes (UFC / Departamento de Computação)
Prof. Ricardo Bastos Cavalcante Prudêncio (UFPE / Centro de Informática)
RESUMO:
Técnicas de detecção de anomalias são amplamente utilizadas em diversos
cenários para identificar instâncias com padrões distintos do comportamento
geral observado em um conjunto de dados. O desenvolvimento de novas
técnicas, como as baseadas em aprendizado profundo, e a maior
disponibilidade de dados têm alavancado ainda mais o uso da detecção de
anomalias em contextos diversos como na detecção de falhas em equipamentos
industriais. Comumente, uma técnica de detecção gera para cada instância um
\textit{score} de anomalia, que é então usado para classificar as
instâncias entre anômalas ou normais. Para realizar a classificação, um
limiar de decisão (\textit{threshold}) é estabelecido de forma que se o
\textit{score} de uma determinada instância for superior ao
\textit{threshold}, esta instância é considerada anômala, caso contrário é
classificada como normal. Neste trabalho, foi investigado o impacto de
diferentes abordagens não-supervisionadas usadas para definição de
\textit{thresholds}, avaliadas especificamente para a detecção de anomalias
\textit{online} por um modelo de Sparse Autoencoder (SAE). Para os
experimentos, foi utilizada uma base de dados pública referente a um
problema de detecção de anomalias no metrô da cidade do Porto. Foi
constatado que a abordagem de cálculo do \textit{threshold} impactou
fortemente as métricas de avaliação da detecção. Por exemplo, a abordagem
baseada em erro máximo do SAE garantiu a menor taxa de falsos positivos.
Por sua vez, a abordagem baseada em intervalo interquartil obteve o maior
número de verdadeiros positivos, e, consequentemente \textit{recall},
enquanto que a abordagem baseada em 99-percentil garantiu o maior F1-Score.
Além desses experimentos, foi avaliado ainda o uso de três tipos de filtros
passa-baixa em duas abordagens distintas para a suavização do
\textit{score} de anomalia. De uma forma geral, a aplicação de filtros
diretamente sobre o \textit{score} de anomalia garantiu uma maximização de
verdadeiros positivos, enquanto a aplicação de filtros após uma
classificação prévia das instâncias minimizou os falsos positivos. Além
disso, foi verificado que a utilização do filtro foi essencial para
detectar sequências de anomalias.
Palavras-chave: Detecção de Anomalias. Sparse Autoencoder. Threshold.
Filtro Passa-Baixa.
Comentários desativados