Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 2.128
Aluna: Maynara Donato de Souza
Orientador: Prof. Cleber Zanchettin
Título: Using Generative Methods for Enhancing Wearable Device Data via
Synthetic Samples
Data: 20/02/2024
Hora/Local: 8h – Virtual – Interessados em assistir entrar em contato com a aluna
Banca Examinadora:
Prof. Tsang Ing Ren (UFPE / Centro de Informática)
Prof. Leonardo Nogueira Matos (UFS / Departamento de Computação)
Prof. Cleber Zanchettin (UFPE / Centro de Informática)
RESUMO:
Os dispositivos vestíveis oferecem uma maneira conveniente e prática de
monitorar a saúde e o bem-estar dos usuários. Esses equipamentos podem
monitorar sinais como frequência respiratória, nível de oxigênio no sangue,
calorias queimadas, padrões de sono, temperatura e movimentação corporal. A
combinação dessas informações com técnicas de Aprendizagem de Máquina (ML)
permite, além de monitorar, classificar e realizar prescrições das
atividades realizadas pelos usuários, fornecendo insights sobre a saúde,
comportamento, hábitos e estilo de vida do usuário. Apesar de uma gama de
aplicabilidades, o uso desta tecnologia enfrenta desafios desde a aquisição
dos dados até a qualidade das prescrições realizadas, especialmente pra
novos usuários. Outro ponto crucial no uso desta tecnologia são questões de
privacidade e segurança dos dados dos usuários. Estes fatores contribuem
para a escassez de dados úteis para o treinamento dos modelos baseados em
Aprendizagem de Máquina. Esta dissertação aborda o desafio de gerar dados
sintéticos para sensores de dispositivos móveis usando modelos generativos.
O desafio no desenvolvimento destes modelos aumenta se considerarmos que os
dados dos sensores correspondem a dados temporais em diferentes dimensões.
São propostas novas estratégias para geração de dados sintéticos baseados
em Generative Adversarial Network (GAN) e Large Language Models (LLM) para
séries temporais de sinais de sensores de dispositivos vestíveis.
Comparamos nossas abordagens com modelos estado-da-arte e conduzimos uma
investigação experimental sobre o uso destes modelos para aumento de dados,
incluindo um estudo abrangente sobre a qualidade dos dados sintéticos
gerados e seu impacto no desempenho do classificador utilizado. Nossas
descobertas sugerem que exemplos sintéticos podem melhorar o desempenho de
modelos treinados, especialmente quando a quantidade de dados reais é
limitada. A partir dos resultados obtidos, identificamos que a qualidade
dos dados sintéticos é mais importante do que a quantidade na melhoria do
desempenho do classificador treinado. Além das técnicas de geração de dados
sintéticos, a dissertação oferece insights sobre como lidar com a escassez
de dados reais em classificadores de atividades e como avaliar a qualidade
destes dados.
Palavras-chave: Dispositivos vestíveis. Modelos Generativos. Reconhecedor
de Atividades Humanas.
Comentários desativados