Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 2.247
Aluno: Paulo Victor Ferreira Falcão
Orientador: Prof. Roberto Souto Maior de Barros
Título: A semi-supervised learning approach with data drift detection to
deal with ransomware
Data: 28/08/2025
Hora/Local: 9h – Virtual – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Prof. Roberto Souto Maior de Barros (UFPE / Centro de Informática)
Prof. Paulo Mauricio Gonçalves Junior (IFPE / Campus Recife)
Prof. Silas Garrido Teixeira de Carvalho Santos (SiDi Institute Recife)
RESUMO:
O ransomware é conhecido por criptografar arquivos no dispositivo infectado e exigir o pagamento de um resgate para devolver o acesso ao proprietário. Essa ameaça cibernética escalou para proporções significativas devido a algumas condições favoráveis, como métodos de pagamento anônimos facilitados, maior confiança das instituições na infraestrutura digital, ampla disponibilidade de ransomware fáceis de usar, entre outros. O resultado desse crescimento foi a ocorrência de ataques a instituições de diversas áreas. Em um estudo recente, foi constatado que 50% das empresas infectadas levam, em média, uma semana para se recuperar de um ataque, enquanto 97% se recuperam totalmente após 21 dias. Entre as organizações atacadas, 49% pagaram o resgate, e as que não pagaram tiveram custos, no processo de recuperação, que, somados, às vezes eram iguais ou até superiores ao valor exigido pelos atacantes. Portanto, a proteção contra esse tipo de ameaça não pode ser subestimada. Enquanto as empresas devem instruir os funcionários sobre como evitá-lo e seus possíveis métodos de infecção, também precisam estar preparadas para lidar com infecções reais. Uma das formas de lidar com o ransomware, dada a infecção, é detectá-lo. Esta dissertação apresenta uma visão geral dos cenários de análise de detecção de ransomware e também faz contribuições para a abordagem base dos problemas de detecção de ransomware. Ao tentar detectá-lo, uma das primeiras dificuldades enfrentadas é lidar com seu rápido e contínuo desenvolvimento. Assim, os modelos podem se tornar ineficazes e os conjuntos de dados desatualizados rapidamente. Para superar essas dificuldades, propõe-se uma abordagem semi-supervisionada combinada com detecção de desvio de dados. O modelo semi-supervisionado pode aliviar a necessidade de um conjunto de dados totalmente rotulado sempre que novos tipos de ransomware forem lançados. Além disso, a detecção de desvio de dados pode identificar quando essa nova atualização é necessária. Assim, os modelos poderiam ser atualizados mais rapidamente e manter uma alta taxa de detecção. Essa proposta utilizou o modelo Relevant Random Subspace method for Co-training (Rel-RASCO) devido à sua leveza e eficácia, e foi avaliada utilizando dois conjuntos de dados públicos de análise dinâmica. Os resultados mostraram que o método proposto alcançou uma taxa de detecção semelhante nas métricas utilizadas, superando, em alguns casos, a maioria dos resultados de outros trabalhos, mesmo utilizando menos da metade dos dados rotulados.
Palavras-chave: Ransomware Detection. Semi-Supervised Learning. Machine
Learning. Data Drift.
Comentários desativados