Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 1.948

Aluno: Bruno Aguiar de Oliveira
Orientador: Prof. Cleber Zanchettin
Título: Otimizações em Arquiteturas Convolucionais de Estimativa de Idade a partir  de Imagens Faciais
Data: 19/02/2021
Hora/Local: 10h – Virtual
Banca Examinadora:
Prof. Adriano Lorena Inacio de Oliveira (UFPE / Centro de Informática)
Prof. Bruno José Torres Fernandes  (UPE / Escola Politécnica de PE)
Prof. Cleber Zanchettin  (UFPE / Centro de Informática)


RESUMO:

A tarefa de classificação de imagens teve um grande avanço de performance 
graças ao advento de arquiteturas profundas e o seu estado da arte passou a 
ser dominado por elas. Aproveitando a capacidade de extração de 
características de redes amplamente reconhecidas, como a VGG e a ResNet, 
são propostas melhorias em diversos métodos, como por exemplo a estimativa 
de idades utilizando imagens faciais. A estimativa de idade em humanos é 
uma tarefa complexa, visto que o envelhecimento não segue um padrão bem 
definido para todos: a cor da pele, etnia, estilo de vida e gênero 
individualizam fortemente o processo de envelhecimento. Além disto, fatores 
relacionados à imagem, como condições de iluminação, maquiagem e expressões 
faciais, podem dificultar ainda mais a obtenção de uma boa estimativa 
automática. Um bom conjunto de dados de treinamento também é fundamental 
para se alcançar uma boa precisão nas inferências dos modelos baseados em 
aprendizagem de máquina. A obtenção deste tipo de informações não é 
simples, hoje contamos com algumas bases de dados notórias neste campo de 
estudo, sendo a maior o IMDb-WIKI. Ele conta com mais de 500 mil imagens, 
mas a qualidade das anotações não é a ideal. Existem aplicações de 
segurança e de varejo nas quais o emprego de sistemas de identificação de 
idades são úteis, mas nem sempre a obtenção de imagens é economicamente 
viável. Por esta razão, muitas imagens podem ser obtidas em baixas 
resoluções, reduzindo a precisão dos modelos treinados. Esta dissertação 
estuda o emprego de diferentes bases de dados e modificações nestas bases 
de dados em busca de compreender o processo de decisão de redes neurais 
convolucionais na tarefa de estimativa de idades baseadas na imagem da 
face. São também estudadas a aplicação de diferentes arquiteturas 
consagradas na literatura, hiperparâmetros relacionados e mudanças na 
arquitetura de alguns modelos. Por fim, é feito o emprego de um algoritmo 
de super-resolução no pré-processamento das imagens, visando aumentar sua 
resolução a tamanhos considerados ideais para esta tarefa, tornando assim 
possível a obtenção de imagens de entrada em baixa resolução e que ainda 
possam ser utilizadas no treinamento e inferência dos modelos.

Palavras-chave: estimativa de idade, aprendizagem profunda, redes neurais, 
imagens faciais

Comentários desativados