03/02 Tese de Doutorado Nº 688

30 jan

Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 688

Aluno: José Ivson Soares da Silva
Orientador: Prof. Tsang Ing Ren
Título: Otimização de Modelos de Redes Neurais Profundas para Dispositivos
Móveis
Data: 03/02/2026
Hora/Local: 8h – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Prof. Cleber Zanchettin (UFPE / Centro de Informática)
Prof. George Darmiton da Cunha Cavalcanti (UFPE / Centro de Informática)
Prof. Hansenclever de França Bassani (Google)
Prof. Hae Yong Kim (USP / Departamento de Engenharia de Sistemas Eletrônicos)
Prof. Luis Filipe Alves Pereira (UFAPE / Unidade Acadêmica de Garanhuns)

RESUMO:

O Aprendizado Profundo alcançou resultados expressivos em visão computacional, impulsionado principalmente pelo aumento do poder de processamento das GPUs. No entanto, a execução desses modelos modernos em dispositivos móveis impõe desafios de latência, consumo energético e, principalmente, memória RAM. Embora técnicas clássicas de compressão, como a quantização e o pruning, reduzam a complexidade, elas podem degradar a fidelidade visual necessária para aplicações de imagem de alta qualidade. Diante desse cenário, esta tese propõe estratégias de otimização na arquitetura de redes neurais e de fluxo de processamento que viabilizam a execução eficiente no dispositivo sem prejudicar a qualidade visual. O trabalho apresenta três contribuições aplicadas ao contexto móvel, mais especificamente, smartphones. Primeiro, no processamento de sinal de imagens (ISP), propomos uma arquitetura de rede compacta baseada em UNet capaz de substituir o pipeline tradicional, processando dados RAW diretamente para RGB com alta fidelidade e baixo custo de memória. Segundo, para a transferência de estilo, desenvolvemos uma abordagem híbrida que combina uma rede neural leve com um algoritmo baseado em pedaços (patch-based), permitindo a geração de imagens em alta resolução em dispositivos com RAM restrita (4GB), superando limitações de métodos puramente neurais. Por fim, no preenchimento de imagem (inpainting), apresentamos a arquitetura CRConv, que utiliza convoluções com gate guiadas pela Transformada de Distância Euclidiana. Este método atinge um equilíbrio ótimo entre qualidade visual e eficiência, reduzindo o tempo de inferência em 17% comparado ao estado da arte (LaMa).

Palavras-chave: Redes Neurais. Aprendizado profundo. Otimização de modelos. Aplicações para celular. Visão Computacional.

Comentários desativados

Endereço

Av. Jornalista Anibal Fernandes, s/n, Cidade Universitária (Campus Recife)

CEP: 50740-560

Recife/PE

Acompanhe o CIn-UFPE em todas as redes sociais

CONTATO

+ 55 81 2126-8430

contato@cin.ufpe.br

03/02 Tese de Doutorado Nº 688

Sobre este site

Encontre-nos

Endereço

CONTATO