Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/13445
Título: | Uso de técnicas e ferramentas de mineração de dados na extração de informações sobre o comportamento de uso dos recursos da internet na UTFPR - Câmpus Medianeira |
Autor(es): | Valiati, Gustavo Rafael |
Orientador(es): | Menezes, Paulo Lopes de |
Palavras-chave: | CDS/ISIS (Sistema de recuperação da informação) Recuperação da informação Logarítmos CDS/ISIS (Information retrieval system) Information retrieval Logarithms |
Data do documento: | 27-Mar-2013 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Medianeira |
Citação: | VALIATI, Gustavo Rafael. Uso de técnicas e ferramentas de mineração de dados na extração de informações sobre o comportamento de uso dos recursos da internet na UTFPR - Câmpus Medianeira. 2013. 76 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Medianeira, 2013. |
Resumo: | O grande crescimento da capacidade de gerar, transmitir e armazenar dados em meios digitais, tem superado a capacidade humana de extração de conhecimento destes dados. A Mineração de Dados é o processo que surgiu nas últimas décadas, justamente com o objetivo de resolver o problema. Este trabalho apresenta a aplicação da Mineração de Dados, como estudo de caso, em uma grande quantidade de dados em logs, produzidos pelo Squid, em servidores de compartilhamento de Internet, a fim de extrair conhecimento requerido pelo administrador de redes. O trabalho aborda, de maneira detalhada, a realização das etapas da Mineração de Dados, e também alguns empecilhos que atrapalharam a execução de parte do projeto, como: inviabilidade de construção de uma ferramenta automatizada para o processo de Mineração de Dados; incapacidade de determinado hardware suportar processamento de dados requerido; necessidade do uso de novas estratégias na criação de arquivos ARFF grandes, para tornar possível a ferramenta Weka aplicar as tarefas de mineração. Ainda, este trabalho apresenta uma ferramenta de pré-processamento e transformação de dados, criada especificamente para o ambiente encontrado. Como resultados da mineração são apresentados padrões encontrados nos logs juntamente com amostras de interpretações possíveis. Por fim, são listadas algumas oportunidades de novos trabalhos. |
Abstract: | The large increase in capacity to generate, transmit and store data in digital format, has exceeded the human capacity of knowledge extraction of these data. The Data Mining is the process emerged in recent decades, precisely in order to solve the problem. This paper presents the application of Data Mining, as a case study, in a large amount of data in logs, generated by Squid, from Internet sharing servers, to extract knowledge required by the network administrator. The paper discusses, in detail, performing the steps of Data Mining, and also some obstacles that hindered the execution of part of the project, such as inviability of constructing an automated tool to process Data Mining; inability of specific hardware to process the required data; necessity of using new strategies in the creation of large ARFF files, to enable Weka tool to apply mining tasks. Further, this paper presents a tool for preprocessing and data transformation, specifically designed for the environment encountered. And as a result of mining are presented patterns found in the logs along with samples of possible interpretations. At last, a list of some opportunities for new papers is presented. |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/13445 |
Aparece nas coleções: | MD - Tecnologia em Análise e Desenvolvimento de Sistemas |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
MD_COADS_2012_2_04.pdf | 647,15 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.