Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 1.948
Aluno: Bruno Aguiar de Oliveira
Orientador: Prof. Cleber Zanchettin
Título: Otimizações em Arquiteturas Convolucionais de Estimativa de Idade a partir de Imagens Faciais
Data: 19/02/2021
Hora/Local: 10h – Virtual
Banca Examinadora:
Prof. Adriano Lorena Inacio de Oliveira (UFPE / Centro de Informática)
Prof. Bruno José Torres Fernandes (UPE / Escola Politécnica de PE)
Prof. Cleber Zanchettin (UFPE / Centro de Informática)
RESUMO:
A tarefa de classificação de imagens teve um grande avanço de performance
graças ao advento de arquiteturas profundas e o seu estado da arte passou a
ser dominado por elas. Aproveitando a capacidade de extração de
características de redes amplamente reconhecidas, como a VGG e a ResNet,
são propostas melhorias em diversos métodos, como por exemplo a estimativa
de idades utilizando imagens faciais. A estimativa de idade em humanos é
uma tarefa complexa, visto que o envelhecimento não segue um padrão bem
definido para todos: a cor da pele, etnia, estilo de vida e gênero
individualizam fortemente o processo de envelhecimento. Além disto, fatores
relacionados à imagem, como condições de iluminação, maquiagem e expressões
faciais, podem dificultar ainda mais a obtenção de uma boa estimativa
automática. Um bom conjunto de dados de treinamento também é fundamental
para se alcançar uma boa precisão nas inferências dos modelos baseados em
aprendizagem de máquina. A obtenção deste tipo de informações não é
simples, hoje contamos com algumas bases de dados notórias neste campo de
estudo, sendo a maior o IMDb-WIKI. Ele conta com mais de 500 mil imagens,
mas a qualidade das anotações não é a ideal. Existem aplicações de
segurança e de varejo nas quais o emprego de sistemas de identificação de
idades são úteis, mas nem sempre a obtenção de imagens é economicamente
viável. Por esta razão, muitas imagens podem ser obtidas em baixas
resoluções, reduzindo a precisão dos modelos treinados. Esta dissertação
estuda o emprego de diferentes bases de dados e modificações nestas bases
de dados em busca de compreender o processo de decisão de redes neurais
convolucionais na tarefa de estimativa de idades baseadas na imagem da
face. São também estudadas a aplicação de diferentes arquiteturas
consagradas na literatura, hiperparâmetros relacionados e mudanças na
arquitetura de alguns modelos. Por fim, é feito o emprego de um algoritmo
de super-resolução no pré-processamento das imagens, visando aumentar sua
resolução a tamanhos considerados ideais para esta tarefa, tornando assim
possível a obtenção de imagens de entrada em baixa resolução e que ainda
possam ser utilizadas no treinamento e inferência dos modelos.
Palavras-chave: estimativa de idade, aprendizagem profunda, redes neurais,
imagens faciais
Comentários desativados