Pós-Graduação Profissionalem Ciência da Computação CIn / UFPE
Defesa de Dissertação de Mestrado Profissional Nº 333
Nome do Aluno: Ailton José Rodrigues
Nome do Orientador: Cleber Zanchettin
Título: V-LIBRASIL: Uma base de dados com sinais na Língua Brasileira de Sinais (Libras)
Data da Defesa: 02/08/2021
Hora/Local: 10:00h –Virtual
Prof. Leandro Maciel Almeida (CIn/UFPE)
Prof. Mariângela Estelita Barros – (UFG)
Prof. Cleber Zanchettin (CIn/UFPE)
Resumo:
A língua de sinais é uma habilidade de comunicação visual que permite que indivíduos com diferentes tipos de deficiência auditiva e surdez se comuniquem. É a língua e o símbolo de identificação usada, no dia a dia, pelas pessoas com este tipo de deficiência. A grande maioria das pessoas com essa deficiência não têm contato com a língua oficial falada e escrita, e com isso enfrentam severas barreiras de comunicação, tendo enormes dificuldades de acesso a informações básicas e a serviços públicos. Língua Brasileira de Sinais (Libras), é a língua oficial de sinais do Brasil sendo usada por milhões de brasileiros surdos e também ouvintes. É sabido que, apesar dos esforços de inclusão social e laboral, ainda é pequeno o número de ouvintes habilitados a se comunicar por meio de Libras. Essa barreira invisível interfere na comunicação entre esses dois grupos e não promove autonomia do cidadão surdo nas atividades rotineiras de trabalho e de cidadania. Nesse sentido, a Inteligência Artificial (IA) tem sido usada como uma ferramenta para facilitar esta comunicação e promover a inclusão sócio-digital de surdos, oferecendo modelos baseados em aprendizagem de máquina que podem reconhecer e traduzir sinais de uma língua para a outra. Apesar do sucesso dos modelos de aprendizagem de máquina em diferentes tarefas, seu desempenho em reconhecimento de sinais ainda é limitado pela dificuldade de obtenção de dados para treinamento; já que existem poucas e limitadas bases de dados disponíveis nas línguas de sinais e menor ainda é a quantidade de sinais e dados rotulados em Libras. Este trabalho propõe a criação de uma base de dados rotulada de vídeos com intérpretes nativos e tradutores profissionais sinalizando palavras e expressões em Libras. Para a construção desta base foi criada uma metodologia baseada em estudos relacionados, no suporte da equipe de sinalizadores e nas bases existentes na literatura. Outro ponto considerado foi utilizar sinais que permitam fazer uma correlação com uma das principais bases de dados de sinais utilizada na literatura, a base de Sinais Americana (em inglês, American Sign Language Video Dataset – ASLVD), de forma a viabilizar uma associação entre os sinais em Libras e os sinais em ASL a fim de fomentar o desenvolvimento de sistemas de reconhecimento e tradução entre as duas línguas de sinais. O dataset V-LIBRASIL é constituído de um corpus paralelo Português-Libras. A partição em Português é formada por 1364 termos extraídos e traduzidos da parte em Inglês do corpus paralelo English – ASL da base ASLLVD. Esses termos foram sinalizados na Língua Brasileira de Sinais por 3 articuladores especialistas totalizando 4.066 sinais que integram a partição Libras da base V-LIBRASIL. Ademais, para oferecer uma cobertura a diferentes planos de fundo, os articuladores foram filmados em um ambiente chroma key, o qual permite adicionar diferentes cenários de fundo após a gravação dos sinais, possibilitando o treinamento de modelos computacionais mais robustos a ruídos e condições adversas. A base de dados está disponibilizada em um portal estruturado V-LIBRASIL Vídeo Dataset (https://libras.cin.ufpe.br/), o qual permite a pesquisa por sinais e também o download dos dados para fomentar o desenvolvimento de novos modelos e sistemas na área de reconhecimento de língua de sinais.
Palavras-chave: Língua brasileira de sinais, LIBRAS, ASL, Reconhecimento de sinais.
Comentários desativados