Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/13421
Título: Um estudo sobre a aplicabilidade de big data na rede social Twitter
Autor(es): Gonçalves, Isabella Grzeczeczen
Orientador(es): Lamb, Juliano Rodrigo
Palavras-chave: Mineração de dados (Computação)
Anúncios pela Internet
Processo decisório
Data mining
Internet advertising
Decision making
Data do documento: 10-Jun-2015
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Medianeira
Citação: GONCALVES, Isabella Grzeczeczen. Um estudo sobre a aplicabilidade de big data na rede social Twitter. 2015. Trabalho de Conclusão de Curso (Tecnologia em análise e desenvolvimento de sistemas) - Universidade Tecnológica Federal do Paraná, Medianeira, 2015.
Resumo: O presente trabalho é embasado teoricamente em estudos sobre a aplicação de Big Data nas redes social Twitter. O trabalho teve como objetivo a criação de um estudo sobre as ferramentas utilizadas para a mineração dos dados por meio da análise de sentimento. Teve como ferramentas principais o Apache Hadoop e o Hortonworks Data Plataform que foram imprescindíveis para a análise de Big Data. Este estudo possibilitou um programador por meio de Hadoop pudesse extrair dados de sentimento do Twitter para analisar o desempenho de um lançamento de um produto. Para isso, foi necessário fazer o download e extrair os arquivos de sentimento criados por meio da coleta do Apache Flume, agregando grandes quantidades de dados de fluxo para o Hadoop Distributed File System (HDFS). Em seguida, foi feito o carregamento dos arquivos de dados do Twitter criados para a Hortonworks Sandbox, o singlenode cluster Hadoop rodado na Máquina Virtual. Foi utilizado o HCatalog para construir uma visão relacional dos dados onde, em seguida foi feita a cópia e execução do script Hive para a Sandbox para o possível refinamento dos dados brutos e consulta destes dados. Por fim foi possível importar e acessar esses dados refinados com a utilização do Microsoft Excel, e a visualização dos dados de sentimento usando o Excel Power View.
Abstract: This study is theoretically grounded in research on the application of Big Data on social network Twitter. The work aims to create a study of the tools used for Data Mining through sentiment analysis. And had as main tools the Apache Hadoop and the Hortonworks Data Platform that were essential for the analysis of Big Data. This study enabled a programmer through Hadoop could extract the Twitter sentiment data to analyze the performance of a release of a particular movie. For this, you need to download and extract the feeling of files created by collecting the Apache Flume, adding large amounts of flow data to the Hadoop Distributed File System (HDFS). Then loading the Twitter data files created for Hortonworks Sandbox was done, the Hadoop cluster singlenode shot in Virtual Machine. It was used the HCatalog to build a relational view of the data where then the copying is done and execution of the Hive script for the Sandbox for possible refinement of raw data and query this data. Finally we were able to download and access these refined data using Microsoft Excel, and the sense of data displayed using Excel Power View.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/13421
Aparece nas coleções:MD - Tecnologia em Análise e Desenvolvimento de Sistemas

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
MD_COADS_2015_1_08.pdf3,19 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.