Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/6000
Título: Modelagem de tópicos em redes sociais de políticos brasileiros
Título(s) alternativo(s): Topic modeling in social media of brazilian politicians
Autor(es): Regis, Kevin Perondi
Orientador(es): Schwerz, André Luís
Palavras-chave: Redes sociais
Políticos
Algorítmos computacionais
Social networks
Politicians
Computer algorithms
Data do documento: 29-Nov-2019
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Campo Mourao
Citação: REGIS, Kevin Perondi. Modelagem de tópicos em redes sociais de políticos brasileiros. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019.
Resumo: Com o surgimento das redes sociais, tornou-se possível reduzir a distância entre as pessoas e até mesmo estabelecer relações entre pessoas desconhecidas que partilham de um ideal em comum. Aproveitando-se dessa ideia, o cenário político brasileiro tem se adaptado a essa tecnologia com a atuação dos candidatos nas mídias sociais desde meados de 2010. As redes sociais se tornaram uma ferramenta fundamental para a divulgação de campanhas eleitorais e definições de estratégias para agradar o seu eleitorado. A popularidade do uso das redes sociais tem como consequência a geração de uma infinidade de dados complexos que podem ser analisados e explorados. Com o grande volume de dados, surge a necessidade de aplicar métodos e ferramentas a fim de processar e sintetizar as informações, facilitando a sua interpretação. Dentre os métodos utilizados, a modelagem de tópicos visa encontrar tópicos latentes contidos em um documento levando em consideração a ocorrência das palavras. Assim, o presente trabalho tem como objetivo verificar a eficiência do algoritmo para modelagem de tópicos conhecido como Latent Dirichlet Allocation (LDA). Para tanto, foi definido como público alvo os Senadores da República em exercício a partir do ano de 2015, visando coletar informações de suas publicações em páginas públicas na rede social Facebook. Após a coleta dos dados e aplicação do algoritmo LDA, verificou-se por meio de uma classificação manual os resultados obtidos, buscando avaliar o seu desempenho em termos de acertos e erros. Nesse processo, verificou-se um total de 7.694 publicações com classificação adequada (≥ 0,7) a partir das 112.584 publicações. Tal taxa representa 6,8% das publicações analisadas. A partir deste montante de publicações, foi realizada uma verificação manual com o intuito de apurar a quantidade de acertos e erros, o qual observou-se que o algoritmo obteve 5.239 acertos (4,7%) e 2.455 erros (2,2%). Assim, no presente trabalho a aplicação do algoritmo LDA não foi capaz de sintetizar precisamente os assuntos relevantes em um determinado conjunto de dados, levando em consideração a sua eficiência de padrão médio para a classificação de tópicos.
Abstract: With the emergence of social networks, it has become possible to reduce the distance between people and even establish relationships between unknown people who share a common ideal. Taking advantage of this idea, the Brazilian political scene has been adapting to this technology with the acting of candidates in social media since mid-2010. Social networks have become a fundamental tool for the dissemination of election campaigns and definitions of strategies to please the your electorate. The popularity of using social networks results in the generation of a multitude of complex data that can be analyzed and exploited. With the large volume of data, there is a need to apply methods and tools in order to process and synthesize information, facilitating its interpretation. Among the methods used, topic modeling aims to find latent topics contained in a document taking into account the occurrence of words. Thus, the present work aims to verify the efficiency of topic modeling algorithm known as LDA. Therefore, it was defined as target audience the Senators of the Republic in exercise from 2015, aiming to collect information from their publications on public pages on the social network Facebook. After data collection and application of the LDA algorithm, the results obtained were verified through a manual classification, trying to evaluate their performance in terms of hits and errors. In this process, there were a total of 7.694 publications with appropriate classification (≥ 0.7) from the 112.584 publications. This rate represents 6.8% of the publications analyzed. From this amount of publications, a manual verification was performed to determine the number of hits and errors, which showed that the algorithm obtained 5,239 hits (4.7%) and 2.455 errors (2.2%). Thus, in the present work the application of the gls LDA algorithm was unable to precisely synthesize the relevant subjects in a given data set, taking into account their average standard efficiency for the classification of topics.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/6000
Aparece nas coleções:CM - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
modelagemredessociaispoliticos.pdf1,3 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.