O trabalho foi realizado pelo Voxar Lab, laboratório de pesquisa do CIn-UFPE
O doutorando em Ciência da Computação no Centro de Informática (CIn) da UFPE, Kelvin B. da Cunha, desenvolveu o artigo “O impacto da randomização de domínio na detecção monocular profunda de 6DoF entre dispositivos”, que foi publicado na revista Pattern Recognition Letters. Outros autores envolvidos na pesquisa são Caio Brito, Lucas Valença, Lucas Figueiredo, Francisco Simões e Veronica Teichrieb. Todos, assim como Kelvin, integram o grupo Voxar Lab, laboratório de pesquisa sobre realidade estendida, visão computacional e interação natural do CIn-UFPE.
O trabalho compara diferentes estratégias para treinamento de modelos de estimação de poses 6DoF profundos que usam uma câmera RGB monocular como entrada, combinando dados reais e sintéticos (com randomização de domínio, criando um conjunto de dados de treinamento com muita variação), em mais de 110.000 quadros anotados, para investigar como lidar melhor com desafios do mundo real.
Kelvin B. da Cunha, primeiro autor do artigo, explica que “a pesquisa traz uma discussão sobre pontos importantes e problemas práticos para detecção de objetos e estimação de pose, fornecendo um estudo que descreve como mudanças das distribuições de treinamento impactam no resultado de modelos de aprendizado supervisionados e como podemos aplicar diferentes estratégias de treinamento para lidar com tais mudanças, obtendo modelos mais precisos utilizando menos dados rotulados”.
As mudanças em questão estão relacionadas ao ambiente, à aparência do objeto e às diferenças entre dispositivos utilizados para capturar imagens (e.g., características dos sensores, qualidade da imagem, processamento do hardware), que acontecem frequentemente em casos reais e ainda são pouco exploradas na área, na qual as técnicas são majoritariamente avaliadas em cenários experimentais, restritos e controlados. A pesquisa do Voxar Lab, então, disponibiliza um novo conjunto de dados que abrange esses cenários reais e possibilita avaliações mais robustas, pois entender e lidar com esses problemas é muito relevante para a indústria na criação e implantação de soluções mais acessíveis e eficientes dentro da área de visão computacional.
Comentários desativados