Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/13421
Título: | Um estudo sobre a aplicabilidade de big data na rede social Twitter |
Autor(es): | Gonçalves, Isabella Grzeczeczen |
Orientador(es): | Lamb, Juliano Rodrigo |
Palavras-chave: | Mineração de dados (Computação) Anúncios pela Internet Processo decisório Data mining Internet advertising Decision making |
Data do documento: | 10-Jun-2015 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Medianeira |
Citação: | GONCALVES, Isabella Grzeczeczen. Um estudo sobre a aplicabilidade de big data na rede social Twitter. 2015. Trabalho de Conclusão de Curso (Tecnologia em análise e desenvolvimento de sistemas) - Universidade Tecnológica Federal do Paraná, Medianeira, 2015. |
Resumo: | O presente trabalho é embasado teoricamente em estudos sobre a aplicação de Big Data nas redes social Twitter. O trabalho teve como objetivo a criação de um estudo sobre as ferramentas utilizadas para a mineração dos dados por meio da análise de sentimento. Teve como ferramentas principais o Apache Hadoop e o Hortonworks Data Plataform que foram imprescindíveis para a análise de Big Data. Este estudo possibilitou um programador por meio de Hadoop pudesse extrair dados de sentimento do Twitter para analisar o desempenho de um lançamento de um produto. Para isso, foi necessário fazer o download e extrair os arquivos de sentimento criados por meio da coleta do Apache Flume, agregando grandes quantidades de dados de fluxo para o Hadoop Distributed File System (HDFS). Em seguida, foi feito o carregamento dos arquivos de dados do Twitter criados para a Hortonworks Sandbox, o singlenode cluster Hadoop rodado na Máquina Virtual. Foi utilizado o HCatalog para construir uma visão relacional dos dados onde, em seguida foi feita a cópia e execução do script Hive para a Sandbox para o possível refinamento dos dados brutos e consulta destes dados. Por fim foi possível importar e acessar esses dados refinados com a utilização do Microsoft Excel, e a visualização dos dados de sentimento usando o Excel Power View. |
Abstract: | This study is theoretically grounded in research on the application of Big Data on social network Twitter. The work aims to create a study of the tools used for Data Mining through sentiment analysis. And had as main tools the Apache Hadoop and the Hortonworks Data Platform that were essential for the analysis of Big Data. This study enabled a programmer through Hadoop could extract the Twitter sentiment data to analyze the performance of a release of a particular movie. For this, you need to download and extract the feeling of files created by collecting the Apache Flume, adding large amounts of flow data to the Hadoop Distributed File System (HDFS). Then loading the Twitter data files created for Hortonworks Sandbox was done, the Hadoop cluster singlenode shot in Virtual Machine. It was used the HCatalog to build a relational view of the data where then the copying is done and execution of the Hive script for the Sandbox for possible refinement of raw data and query this data. Finally we were able to download and access these refined data using Microsoft Excel, and the sense of data displayed using Excel Power View. |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/13421 |
Aparece nas coleções: | MD - Tecnologia em Análise e Desenvolvimento de Sistemas |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
MD_COADS_2015_1_08.pdf | 3,19 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.