Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/22181
Título: | Revisão de métodos para análise de agrupamento de dados em data mining |
Título(s) alternativo(s): | Review of methods for data clustering analysis in data mining |
Autor(es): | Trevisan, Luiz Fernando |
Orientador(es): | Casanova, Dalcimar |
Palavras-chave: | Banco de dados Mineração de dados (Computação) Armazenamento de dados Data bases Data mining Data Warehousing |
Data do documento: | 23-Fev-2017 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Pato Branco |
Citação: | TREVISAN, Luiz Fernando. Revisão de métodos para análise de agrupamento de dados em data mining. 2017. 25 f. Trabalho de Conclusão de Curso (Especialização) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2017. |
Resumo: | Os componentes centrais da tecnologia de mineração de dados estão em desenvolvimento há décadas. Hoje, a maturidade dessas técnicas, aliada aos motores de banco de dados de alto desempenho e aos amplos esforços de integração de dados, tornam essas tecnologias práticas para os ambientes atuais. A análise de agrupamento tem como objetivo separar objetos em grupos, agrupando-os de acordo com as suas características em comum com um critério pré-determinado, identificado padrões compreensíveis. Para realizar esta classificação as diversas técnicas de mineração de dados utilizam funções matemáticas complexas. Nesse contexto, até mesmo uma abstração mais fácil das formulas para agrupamento de dados não é simples de ser entendida, principalmente para quem não é da área ou não tem conhecimento de conceitos matemáticos. O objetivo deste trabalho é esclarecer as fórmulas de alguns métodos de agrupamento de dados, explicando-os de forma pratica e objetiva, com exemplos, de como eles funcionam. Para isso foram escolhidos 3 algoritmos do mesmo gênero, k-means, k-medians e k-medoids, para serem detalhados utilizando o mesmo conjunto de dados. |
Abstract: | The core components of data mining technology have been in development for decades. Today, the maturity of these techniques, coupled with high-performance database engines and extensive data integration efforts, make these technologies practical for today's environments. The cluster analysis aims to separate objects into groups, grouping them according to their characteristics in common with a predetermined criterion, identifying comprehensible patterns. To perform this classification the various data mining techniques use complex mathematical functions. In this context, even an easier abstraction of the formulas for grouping data is not simple to understand, especially for those who are not from the area or have no knowledge of mathematical concepts. The purpose of this work is to clarify the formulas of some methods of grouping data, explaining them in a practical and objective way, with examples, of how they work. For this, 3 algorithms of the same genre, k-means, k-medians and k-medoids were chosen to be detailed using the same set of data. |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/22181 |
Aparece nas coleções: | PB - Banco de Dados: Administração e Desenvolvimento |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
PB_EBD_02_2017_14.pdf | 845,14 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.