Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/33684
Título: Técnicas de aprendizado de máquina e mineração de textos aplicadas para a previsão da avaliação de consumidores de e-commerce
Título(s) alternativo(s): Application of machine learning and text mining techniques to predict e-commerce consumer evaluation
Autor(es): Almeida Filho, Ricardo Franco de
Orientador(es): Andrade, Pedro Rochavetz de Lara
Palavras-chave: Mineração de dados de texto
Processamento de linguagem natural (Computação)
Análise de sentimentos
Aprendizado do computador
Text data mining
Natural language processing (Computer science)
Sentiment Analysis
Machine learning
Data do documento: 22-Nov-2023
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Londrina
Citação: ALMEIDA FILHO, Ricardo Franco de. Técnicas de aprendizado de máquina e mineração de textos aplicadas para a previsão da avaliação de consumidores de e-commerce. 2023. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Londrina, 2023.
Resumo: O e-commerce tem crescido nos últimos anos no Brasil, estando cada dia mais presente no cotidiano de milhões de pessoas. Em um mercado cada vez mais competitivo as empresas buscam se diferenciar proporcionado um melhor atendimento ao cliente, para isso a análise dos dados gerados por seus consumidores é vital, independentemente de seus formatos. A análise de sentimentos une conceitos de processamento de linguagem natural e aprendizagem de máquinas de forma a extrair as opiniões contidas nos textos através de uma classificação, tradicionalmente associada a um sentimento “positivo” ou “negativo”. Este trabalho visa analisar sentimentos de clientes de um determinado produto da Amazon utilizando técnicas de processamento de linguagem natural e aprendizado de máquina para a análise de avaliações/opiniões de consumidores, de forma a classificar seu sentimento em relação ao produto. Foram testados cenários para apurar o impacto de diferentes técnicas de pré-processamento nos resultados obtidos. Além disso, foram utilizadas cinco técnicas de aprendizagem de máquina para classificar os textos: Decision Tree, Naïve Bayes Bernoulli e Naïve Bayes Multinomial, K-nearest Neighbors e Support Vector Machines. Os resultados da aplicação dos diferentes cenários de pré-processamento mostraram que as técnicas afetam diretamente e de diferentes formas cada algoritmo. Os algoritmos obtiveram desempenhos considerados adequados nos quatro cenários testados, sendo que o melhor resultado geral foi obtido pelo Naïve Bayes Multinomial, que obteve 90%, 92%, 91% e 89% de acurácia em cada um dos cenários.
Abstract: E-commerce has grown in recent years in Brazil, becoming increasingly present in the daily lives of millions of people. In an ever-competitive market, companies seek to differentiate themselves by providing better customer service, making the analysis of data generated by their consumers vital, regardless of its formats. Sentiment analysis combines concepts of natural language processing and machine learning to extract opinions contained in texts through classification, traditionally associated with a "positive" or "negative" sentiment. This thesis aims to analyze the sentiments of customers for a specific product on Amazon using techniques of natural language processing and machine learning to analyze consumer reviews/opinions, classifying their sentiment regarding the product. Different pre-processing techniques were tested to assess the impact on the obtained results. Additionally, five machine learning techniques were used to classify the texts: Decision Tree, Naïve Bayes Bernoulli and Naïve Bayes Multinomial, K-nearest Neighbors, and Support Vector Machines. The results of applying different pre-processing scenarios showed that the techniques directly and differently affect each algorithm. The algorithms achieved performances considered adequate in the four scenarios tested, with the overall best result obtained by Naïve Bayes Multinomial, achieving 90%, 92%, 91%, and 89% accuracy in each of the scenarios.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/33684
Aparece nas coleções:LD - Engenharia de Produção

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
mineracaotextosaprendizadomaquina.pdf1,38 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons