Uma proposta para detecção distribuída de intrusões utilizando mineração em fluxos de ambientes big data

Schuartz, Fábio César

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/32287

Título:	Uma proposta para detecção distribuída de intrusões utilizando mineração em fluxos de ambientes big data
Título(s) alternativo(s):	A proposal for distributed intrusion detection using stream mining in big data environments
Autor(es):	Schuartz, Fábio César
Orientador(es):	Fonseca, Mauro Sergio Pereira
Palavras-chave:	Sistemas de detecção de intrusão (segurança informática) Aprendizado do computador Redes de computadores - Medidas de segurança Mineração de dados (Computação) Big data Intrusion detection systems (Computer security) Machine learning Computer networks - Security measures Data mining
Data do documento:	26-Mai-2023
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Curitiba
Citação:	SCHUARTZ, Fábio César. Uma proposta para detecção distribuída de intrusões utilizando mineração em fluxos de ambientes big data. 2023. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023.
Resumo:	Com a enorme expansão das redes de computadores, aumentou a necessidade de proteger os dados e informações que trafegam pela rede. O crescimento em volume, velocidade e variedade dos dados exige um sistema de detecção de intrusão mais robusto, preciso e capaz de analisar uma quantidade gigantesca de dados. Este trabalho propõe a criação de um sistema de detecção de intrusão utilizando uma arquitetura distribuída. O sistema utiliza três camadas de classificação de fluxo de amostras, coletadas a partir da rede, onde cada camada de classificação pode ser composta de um ou mais classificadores, trabalhando em paralelo. Os classificadores são treinados com diferentes métodos de aprendizagem de máquina. Cada camada pode selecionar as principais características a serem utilizadas para classificar as amostras, e uma unidade classificadora final, o Decisor, utiliza o método de votação para determinar o resultado final da classificação. A arquitetura utiliza classificadores em fluxo, porém é possível utilizar classificadores tradicionais. Os resultados obtidos pela arquitetura apresentada, utilizando duas bases de dados para validação do sistema proposto – NSL-KDD e CICIDS2017, mostram ganhos na acurácia de até 18,52% e 3,55%, utilizando as bases NSL-KDD e CICIDS2017, respectivamente. Obteve-se reduções no tempo de classificação de até 35,51% e 94,90%, respectivamente. Um fator negativo gerado pelo trabalho proposto é o aumento no requisito de memória, devido ao uso de diversos classificadores simultaneamente, ao invés de apenas um classificador, utilizado normalmente. Esse aumento na RAM/Hora foi de até 351,42% e 1.016,52% para as bases NSL-KDD e CICIDS2017, respectivamente.
Abstract:	With the enormous expansion of computer networks, the need to protect data and information that travels over the web has increased. The growth in volume, speed, and variety of data requires an intrusion detection system that is more robust, accurate, and capable of analyzing a huge amount of data. This work proposes the creation of an intrusion detection system using a distributed architecture. The system uses three layers of classification of sample streams, collected from the network, where each classification layer can be composed of one or more classifiers, working in parallel. Classifiers are trained with different machine-learning methods. Each layer can select the main characteristics to be used to classify the samples, and a final classification unit, the Decider, uses the voting method to determine the final classification result. The architecture uses stream classifiers, but it is possible to use traditional classifiers. The results obtained by the proposed architecture, using two databases for validation of the proposed system – NSL-KDD and CICIDS2017, show gains in accuracy of up to 18.52% and 3.55%, using the NSL-KDD and CICIDS2017 databases, respectively. Reductions in classification time of up to 35.51% and 94.90%, respectively, were obtained. A negative factor generated by the proposed work is the increase in the memory requirement, due to the use of several classifiers simultaneously, instead of just one classifier, normally used. This increase in RAM/Hour was up to 351.42% and 1016.52% for the NSL-KDD and CICIDS2017 bases, respectively.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/32287
Aparece nas coleções:	CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
deteccaodistribuidaintrusoesmineracao.pdf		1,09 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons