Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/32704
Título: Análise da evolução do discurso com uso de técnicas de modelagem de tópicos
Título(s) alternativo(s): Analysis of the evolution of discourse using topic modeling techniques
Autor(es): Rocha, Eduardo Yoshio da
Orientador(es): Gomes Junior, Luiz Celso
Palavras-chave: Redes sociais on-line
Análise do discurso
COVID-19 (Doença)
Aprendizado do computador
Administração municipal - Brasil
Online social networks
Discourse analysis
COVID-19 (Disease)
Machine learning
Municipal government - Brazil
Data do documento: 24-Jun-2022
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: ROCHA, Eduardo Yoshio da. Análise da evolução do discurso com uso de técnicas de modelagem de tópicos. 2022. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2022.
Resumo: Com o crescente uso das redes sociais, cresce também o impacto que o conteúdo nessas redes tem na sociedade atual, influenciando bilhões de pessoas no mundo todo. Uma vez que nesse mundo virtual a diversidade de assuntos discutidos e ideias expressas é muito grande, a análise do conteúdo disposto nas redes sociais torna-se de grande importância para o entendimento da influência que essas redes têm no comportamento da sociedade como um todo. Assim, o presente trabalho tem o objetivo de analisar a evolução dos discursos em postagens nas redes sociais com o intuito de identificar padrões que permitam avaliar mudanças no discurso, eventos incomuns ou outros fatores relevantes nos seus conteúdos. No cenário atual da pandemia gerada pelo vírus Sars-cov-2, o estudo dos discursos de prefeituras municipais brasileiras em postagens em redes sociais, mais precisamente no Facebook, torna-se relevante para a mencionada análise do comportamento da população durante a pandemia. Este trabalho procurou avaliar a aplicação de duas técnicas de aprendizado de máquina para a análise da evolução do discurso: (i) LDA (Latent Dirichlet Allocation ou Alocação Latente de Dirichlet) com discretização em intervalos de tempo, e (ii) TOT (Topics Over Time ou Tópicos ao Longo do Tempo), sem discretização temporal. Os modelos foram comparados quantitativamente e qualitativamente. A principal contribuição deste trabalho é a comparação das vantagens e desvantagens de cada modelo. Não se pôde obter um resultado claro de qual dos dois é o melhor modelo, pois apesar de o modelo do LDA com discretização representar melhor a evolução por tópicos, o modelo do TOT apresenta métricas melhores na regressão linear que foi feita como parte da análise quantitativa.
Abstract: With the growing use of social networks, the impact that content on these networks has on today’s society also grows, influencing billions of people around the world. Since in this virtual world the diversity of subjects discussed and ideas expressed is very large, the analysis of the content displayed on social networks becomes of great importance for understanding the influence that these networks have on the behavior of society as a whole. Thus, the present work aims to analyze the evolution of discourses in posts on social networks in order to identify patterns that allow us to assess changes in discourse, unusual events or other relevant factors in their content. In the current scenario of the pandemic generated by the Sars-cov-2 virus, the study of the speeches of Brazilian municipal governments in posts on social networks, more precisely on Facebook, becomes relevant for the aforementioned analysis of the behavior of the population during the pandemic. This work sought to evaluate the application of two machine learning techniques for the analysis of speech evolution: (i) LDA (Latent Dirichlet Allocation) with temporal discretization in time intervals, and (ii) ) TOT (Topics Over Time), without temporal discretization. The models are compared quantitatively and qualitatively. The main contribution of this work is the comparison of the advantages and disadvantages of each model. It was not possible to obtain a clear result of which of the two is the best model, because although the LDA model with discretization better represents the evolution by topics, the TOT model presents better metrics in the linear regression that was performed as part of the quantitative analysis.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/32704
Aparece nas coleções:CT - Engenharia de Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
discurso.pdf581,91 kBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons