Classificação de fake news por mineração de texto

Oshita, Ivan Takeshi

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/26202

Título:	Classificação de fake news por mineração de texto
Título(s) alternativo(s):	Classification of fake news by text mining
Autor(es):	Oshita, Ivan Takeshi
Orientador(es):	Santos, Bruno Samways dos
Palavras-chave:	Fake news Mineração de dados (Computação) Sistemas de suporte de decisão Fake news Data mining Decision support systems
Data do documento:	20-Ago-2021
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Londrina
Citação:	OSHITA, Ivan Takeshi. Classificação de fake news por mineração de texto. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Londrina, 2021.
Resumo:	As notícias falsas (conhecidas por fake news) estão sendo intensificadas nas mídias sociais e fóruns online, com o papel fundamental de propagar a desinformação, influenciar e distorcer a realidade. A desinformação está cada vez mais presente em uma sociedade devido à rapidez das transmissões de falsas alegações nas redes sociais, falta de averiguação dos fatos e o aumento do acesso da população às mídias sociais. Além disso, as fake news têm chamado muita atenção do mundo em função de seus impactos negativos na política, economia ou até mesmo pessoais. Portanto, este estudo teve como objetivo classificar notícias em verídicas ou em fake news por meio de técnicas de mineração de textos. Para classificação foi utilizada a ferramenta de mineração de dados WEKA (Waikato Environment for Knowledge Analysis) para aplicação da técnica de árvore de decisão e os recursos Bag-of-Words (BOW) e Term Frequency-Inverse Document Frequency (TF-IDF). O experimento foi avaliado pelas métricas de acurácia, precisão, sensibilidade (ou recall) e f-score, e os resultados obtidos mostraram-se promissores. Os modelos foram validados com o conjunto Fake.br Corpus, o qual possui 7.200 textos de websites que já estão pré-processados no idioma português. O resultado deste experimento mostrou que o modelo TF-IDF obteve o melhor desempenho em relação ao BOW, com uma acurácia de 89,82%.
Abstract:	False news (known as fakes news) is being intensified in social media and online forums, with the fundamental role of spreading misinformation, influencing, and distorting reality. Disinformation is increasingly present in a society due to the rapid transmission of false allegations on social networks, lack of fact-finding and the population's increased access to social media. In addition, fake news has drawn a lot of attention in the world due to its negative impacts on politics, economy, or even personal ones. Therefore, this study aimed to classify news as true or fake news through text mining techniques. For classification, the data mining tool WEKA (Waikato Environment for Knowledge Analysis) was used to apply the decision tree technique and the resources Bag-of-Words (BOW) and Term Frequency-Inverse Document Frequency (TF-IDF).The experiment was evaluated by accuracy, precision, sensitivity (or recall) and f-measure metrics, and the results sought to be promising. The models were validated with the Fake.br Corpus set, which has 7.200 websites texts that are already pre-processed in Portuguese. The result of this experiment showed that the TF-IDF model obtained the best performance in relation to the BOW, with an accuracy of 89.82%.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/26202
Aparece nas coleções:	LD - Engenharia de Produção

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
fakenewsmineracaotexto.pdf		667,09 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas