Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 2.187
Aluno: Miguel Luiz Pessoa da Cruz Silva
Orientador: Prof. Tsang Ing Ren
Título: Detecção de Objetos com Saídas Antecipadas Baseadas em Complexidade da Imagem
Data: 19/02/2025
Hora/Local: 14h – Virtual – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Prof. George Darmiton da Cunha Cavalcanti (UFPE / Centro de Informática)
Prof. Alceu de Souza Britto Junior (PUC/PR / Programa de Pós Graduação em Informática Aplicada)
Prof. Tsang Ing Ren (UFPE / Centro de Informática)
RESUMO:
Redes Neurais Dinâmicas são modelos de aprendizado profundo capazes de ajustar sua complexidade computacional durante a inferência, adaptando o uso de recursos de acordo com a dificuldade da entrada. Dentre essas abordagens, a técnica early exit se destaca por permitir que o modelo interrompa a inferência antecipadamente em amostras mais simples, reduzindo o tempo de processamento e o consumo de recursos sem comprometer significativamente a precisão. No entanto, sua aplicação em tarefas de detecção de objetos ainda é pouco explorada, especialmente devido à complexidade inerente ao reconhecimento simultâneo de múltiplos objetos e diferentes níveis de confiança em uma mesma imagem.
Este trabalho propõe uma abordagem inovadora ao adaptar a arquitetura Single Shot MultiBox Detector (SSD) com ramificações de saída antecipada, permitindo que amostras simples sejam processadas de forma mais eficiente, enquanto entradas mais complexas recebem uma análise mais aprofundada. Para isso, introduz-se um modelo auxiliar de predição do nível de dificuldade, fundamentado em uma metodologia de classificação de complexidade de amostras, aplicada a uma base de dados de detecção de objetos. Os experimentos foram conduzidos utilizando a base de dados KITTI, amplamente reconhecida no contexto de percepção para veículos autônomos por conter imagens de tráfego urbano, incluindo veículos, pedestres e ciclistas em diversas condições de oclusão e iluminação.
Embora a Precisão Média (mAP) obtida pela abordagem proposta tenha permanecido comparável ao modelo tradicional, os resultados experimentais evidenciaram uma redução significativa no tempo de inferência e uma utilização mais eficiente de recursos computacionais, incluindo uso de memória, ciclos de processamento e consumo energético. Essa otimização computacional é particularmente relevante em aplicações onde a capacidade de tomar decisões em tempo real é essencial para a segurança e eficiência do sistema, como veículos autônomos.
Palavras-chave: Visão Computacional, Redes Neurais Dinâmicas, Detecção de Objetos.
Comentários desativados