Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 1989
Aluno: Walber de Macedo Rodrigues
Orientador: Prof. George Darmiton da Cunha Cavalcanti
Título: Dynamic Ensemble of Classifiers and Security Relevant Methods of
Android’s API: An Empirical Study
Data: 10/02/2022
Hora/Local: 14h – Virtual – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:
Prof. George Darmiton da Cunha Cavalcanti (UFPE / Centro de Informática)
Prof. André Câmara Alves do Nascimento (UFRPE / Departamento de Computação)
Prof. Rafael Menelau Oliveira e Cruz (École de Technologie Supérieure /
Département de génie logiciel et des TI)
RESUMO:
O sistema operacional Android disponibiliza funções e métodos de manuseio de dados sensíveis para proteger os dados dos usuários. Dados sensíveis são todo tipo de dados que podem identificar o usuário, como localização de GPS, dados biométricos e informações bancárias. A literatura de segurança Android propõe extrair features binárias de um método e classificar-lo em uma das classes de Security Relevant Methods, agregando informação de o método manuseia dados sensíveis. Entretanto, existe uma lacuna na literatura onde não são avaliados algoritmos de Ensemble Dinâmico. Os algoritmos de Ensemble Dinâmico são estado da arte para Sistemas de Múltiplos classificadores, que por sua vez, não atacam objetivamente o tipo específico de features binárias. Assim sendo, este trabalho endereça a lacuna em relação a algoritmos de Ensemble Dinâmicos aplicados ao problema de classificação de Security Relevant Methods. Nossas análises mostram que, ao contrário do que é inicialmente posto pela literatura, SVM não é o melhor classificador para esse problema, sendo MLP, Random Forest, Gradient Boosted Decision Trees e META-DES usando \text{Random Forest como geração do pool os melhores resultados. Também constatamos que, em geral, algoritmos de Ensemble Dinâmico possuem uma desvantagem em relação aos classificadores monolíticos. Ademais, essa desvantagem é exarcebada em algoritmos que utilizam classificadores baseados em distância, como o OLP. Quando utlizamos o algoritmo de embedding Triplet Loss, observamos um aumento de performance para o kNN e OLP, mas não de outras técnicas de Ensemble Dinâmico, mostrando que um conjunto de features binárias tem impacto mais significativo sobre esses algoritmos.
Palavras-chave: Security Relevant Methods. Métodos de Ensemble. Sistema de Múltiplos Classificadores. Ensenmble Dinâmico.
Comentários desativados