Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 630
Aluno: Mouglas Eugênio Nasário Gomes
Orientador: Prof. Paulo Salgado Gomes de Mattos Neto
Coorientador: Prof. Cleber Zanchettin
Título: UM MODELO PARA DETECÇÃO DE QUEDAS HUMANAS BASEADO EM VISÃO COMPUTACIONAL
Data: 12/07/2024
Hora/Local: 9h
Banca Examinadora:
Prof. Adriano Lorena Inácio de Oliveira (UFPE / Centro de Informática)
Prof. Tsang Ing Ren (UFPE / Centro de Informática )
Prof. Bruno José Torres Fernandes (UPE / Escola Politécnica de Pernambuco)
Prof. Leonardo Nogueira Matos (UFS / Programa de Pós-Graduação em Ciência da Computação)
Prof. Ricardo Cerri (USP / Instituto De Ciências Matemáticas e de Computação)
RESUMO:
No âmbito da detecção de ações e reconhecimento de atividades humanas, a detecção de quedas emerge devido à sua excelente aplicação para o bem-estar público. A detecção de quedas pode ser implementada em instalações como asilos, áreas com câmeras públicas e residências de idosos que moram sozinhos, pois a grande maioria das fatalidades relacionadas a quedas ocorre nesses locais. Desta forma, esta tese explora o problema da detecção de quedas em humanos, apenas por meio de imagens de vídeos. Sendo esse um problema importante e de aplicações praticas, devido ao crescimento da população mais velha e a alta taxa de pessoas que sofrem lesões em virtude de quedas. A maioria dos sistemas atuais tem inspiração em modelos de detecção de ações humanas, tais modelos são computacionalmente caros, e sujeitos a alarmes falsos, devido a incorporação de características de movimentos que as pessoas usam no dia a dia, os quais podem ser confundidas com os de quedas. Assim, aborda-se o problema com dois modelos. O primeiro utiliza um detector um objetos combinado com modelos de classificação temporal e um algoritmo de rastreamento, que são usados para detectar quedas individualmente em fluxos de vídeo. Os seguintes passos são tomados na utilização desta da abordagem proposta: (i) a região da imagem em que ocorreu a queda é localizada; (ii) são rastreadas e extraídas as regiões que compõem a queda em uma sequência temporal de imagens, formando-se uma série de ações associadas a uma determinada pessoa; e (iii) um modelo é construído para classificar a sequência consecutiva de imagens e agregar a informação temporal. O segundo modelo utiliza um detector de pontos chaves inspirado na arquitetura dos detectores de objetos, mas substituindo o modelo pré-treinado e alterando a estrutura do algoritmo para torná-lo um detector de pontos chaves, mudando a forma como a função de perda é calculada no processo de aprendizagem e alterando o algoritmo de filtragem na última camada, também foi adicionado o fluxo ótico para aferir a velocidade e direção dos pontos detectados para ao final serem utilizados em um modelo temporal. Ambos os modelos propostos são comparados com outros métodos da literatura utilizando métricas conhecidas. Simulações experimentais com várias bases de dados e modelos da literatura, mostram que os melhores resultados na maioria das métricas avaliadas são alcançados usando as abordagens propostas.
Palavras-chave: Detecção de queda, Vídeo vigilância, Reconhecimento da ação
humana, Visão de máquina, Redes profundas, Detecção de ação.
Comentários desativados