Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 2.192

Aluno: Cleber Tavares de Moura
Orientador: Prof. Ricardo Massa Ferreira Lima
Título: AVALIAÇÃO DE DESEMPENHO DAS ESTRATÉGIAS DE PARTICIONAMENTO DE GRANDES VOLUMES DE DADOS APLICADA AO JUMP
Data: 26/02/2025
Hora/Local: 14h – Virtual – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Prof. Adriano Lorena Inacio de Oliveira (UFPE / Centro de Informática)
Prof. Raphael Jose D’Castro  (TJPE/Secretaria de Tecnologia da Informação e Comunicação)
Prof. Ricardo Massa Ferreira de Lima (UFPE / Centro de Informática)

RESUMO:

O crescimento exponencial na geração e no armazenamento de dados, impulsionado por fontes como dispositivos conectados, redes sociais e aplicativos móveis, tem gerado desafios significativos para o processamento e a análise eficiente dessas informações. Nesse contexto, é essencial que as organizações desenvolvam e implementem estratégias eficazes para gerenciar o grande volume de dados. No caso dos sistemas de processo judicial eletrônico (PJ-e), o aumento no número de processos judiciais resulta em um volume massivo de dados, o que cria desafios adicionais e exige estratégias adequadas de particionamento e gerenciamento. Com o objetivo de abordar essas questões, foi realizada uma pesquisa para avaliar detalhadamente e comparar três estratégias de particionamento: por intervalo, por hash e a estratégia dinâmica (que combina hash com a criação dinâmica das partições), aplicadas a soluções que processam grandes volumes de dados. Para isso, foi conduzido um experimento para analisar o desempenho dessas estratégias utilizando o JuMP (Judiciário com Mineração de Processos). Antes da aplicação das estratégias de particionamento, foram coletadas métricas de desempenho do JuMP no seu estado atual, simulando cargas típicas de trabalho com dados provenientes de registros de eventos processuais do PJ-e. Os testes foram conduzidos em um ambiente controlado, utilizando o particionamento padrão atualmente implementado. Essas métricas serviram como referência (baseline) para comparação com os resultados obtidos após a aplicação das estratégias selecionadas. As métricas de desempenho selecionadas para a comparação foram o tempo de processamento, a utilização de recursos e a escalabilidade. Cada estratégia foi configurada de acordo com suas características específicas e, para garantir uma avaliação justa, todos os parâmetros relevantes, como o número de nós de processamento e a configuração de hardware, foram mantidos constantes entre os diferentes testes. Os resultados experimentais mostraram que o particionamento por intervalo foi eficiente em testes de carga com até 13 usuários simultâneos, especialmente para consultas que abrangem dados dos últimos 5 anos. O particionamento por hash permitiu consolidar dados de tribunais em uma única tabela, mas o tempo de resposta foi semelhante ao do particionamento por intervalo. A estratégia dinâmica (hash + criação dinâmica de partições) se destacou como a mais adequada, pois não apenas distribui os dados de forma eficiente, mas também permitiu a criação automática de partições conforme os dados crescem. Isso trouxe ganhos significativos em escalabilidade e manutenção, pois adaptou-se automaticamente ao aumento do volume de dados. Logo, conclui-se que estratégia dinâmica se mostrou a solução mais eficiente em termos de desempenho, flexibilidade e facilidade de manutenção, sendo a mais recomendada para sistemas como o PJ-e, que lidam com grandes volumes de dados.

Palavras-chave: avaliação de desempenho, particionamento de dados, estratégias de particionamento, grandes volumes de dados, big data, bancos de dados relacionais, modelos de dados particionados, mineração de processos, log de eventos, performance, escalabilidade.

Comentários desativados

Sobre este site

Portal institucional do Centro de Informática – UFPE

Encontre-nos

Endereço
Av. Jornalista Aníbal Fernandes, s/n – Cidade Universitária.
Recife-PE – Brasil
CEP: 50.740-560

Horário
Segunda–Sexta: 8:00–18:00