Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/22181
Título: Revisão de métodos para análise de agrupamento de dados em data mining
Título(s) alternativo(s): Review of methods for data clustering analysis in data mining
Autor(es): Trevisan, Luiz Fernando
Orientador(es): Casanova, Dalcimar
Palavras-chave: Banco de dados
Mineração de dados (Computação)
Armazenamento de dados
Data bases
Data mining
Data Warehousing
Data do documento: 23-Fev-2017
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Pato Branco
Citação: TREVISAN, Luiz Fernando. Revisão de métodos para análise de agrupamento de dados em data mining. 2017. 25 f. Trabalho de Conclusão de Curso (Especialização) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2017.
Resumo: Os componentes centrais da tecnologia de mineração de dados estão em desenvolvimento há décadas. Hoje, a maturidade dessas técnicas, aliada aos motores de banco de dados de alto desempenho e aos amplos esforços de integração de dados, tornam essas tecnologias práticas para os ambientes atuais. A análise de agrupamento tem como objetivo separar objetos em grupos, agrupando-os de acordo com as suas características em comum com um critério pré-determinado, identificado padrões compreensíveis. Para realizar esta classificação as diversas técnicas de mineração de dados utilizam funções matemáticas complexas. Nesse contexto, até mesmo uma abstração mais fácil das formulas para agrupamento de dados não é simples de ser entendida, principalmente para quem não é da área ou não tem conhecimento de conceitos matemáticos. O objetivo deste trabalho é esclarecer as fórmulas de alguns métodos de agrupamento de dados, explicando-os de forma pratica e objetiva, com exemplos, de como eles funcionam. Para isso foram escolhidos 3 algoritmos do mesmo gênero, k-means, k-medians e k-medoids, para serem detalhados utilizando o mesmo conjunto de dados.
Abstract: The core components of data mining technology have been in development for decades. Today, the maturity of these techniques, coupled with high-performance database engines and extensive data integration efforts, make these technologies practical for today's environments. The cluster analysis aims to separate objects into groups, grouping them according to their characteristics in common with a predetermined criterion, identifying comprehensible patterns. To perform this classification the various data mining techniques use complex mathematical functions. In this context, even an easier abstraction of the formulas for grouping data is not simple to understand, especially for those who are not from the area or have no knowledge of mathematical concepts. The purpose of this work is to clarify the formulas of some methods of grouping data, explaining them in a practical and objective way, with examples, of how they work. For this, 3 algorithms of the same genre, k-means, k-medians and k-medoids were chosen to be detailed using the same set of data.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/22181
Aparece nas coleções:PB - Banco de Dados: Administração e Desenvolvimento

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
PB_EBD_02_2017_14.pdf845,14 kBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.