Análise de sentimentos em comentários de aplicativos comerciais

Theisen, Lucas Evandro

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/39384

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Theisen, Lucas Evandro	-
dc.date.accessioned	2026-02-13T17:45:40Z	-
dc.date.available	2026-02-13T17:45:40Z	-
dc.date.issued	2025-12-01	-
dc.identifier.citation	THEISEN, Lucas Evandro. Análise de sentimentos em comentários de aplicativos comerciais. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Santa Helena, 2025.	pt_BR
dc.identifier.uri	http://repositorio.utfpr.edu.br/jspui/handle/1/39384	-
dc.description.abstract	Online platform reviews frequently exhibit inconsistencies between textual content and numerical ratings assigned by users, compromising the reliability of the evaluation system. This work developed a sentiment analysis tool to automatically classify reviews into five sentiment classes. A total of 3,000 reviews were collected from five applications in the Shopping category on the Google Play Store, which were subjected to automatic re-annotation processes using the GPT-4 and Gemini 2.5 Pro language models, in addition to filtering with the LeIA sentiment analysis model, aiming to mitigate existing discrepancies between textual reviews and their numerical ratings. Four Transformer architectures were evaluated through fine-tuning: BERTimbau Base, BERTimbau Large, mBERT Base, and XLM-RoBERTa Base, varying hyperparameters such as batch size and learning rate, in addition to applying data cleaning and standardization techniques together with class weighting. The results demonstrated that re-annotation with Gemini 2.5 Pro was the most impactful factor, providing an average gain of 47.2% in macro F1-score, while re-annotation with GPT-4 resulted in a gain of 32.3%. Filtering with LeIA proved effective only in datasets with greater inconsistencies. The BERTimbau Base model trained with the dataset re-annotated by Gemini 2.5 Pro was selected to compose the final tool, achieving a macro F1-score of 0.79. The tool was made available through a RESTful API developed in FastAPI and a multiplatform front-end application in Flutter, deployed with Docker and Docker Compose. The experiments showed that data annotation quality has a direct and substantial impact on model performance, being more relevant than hyperparameter adjustments or filtering techniques.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Tecnológica Federal do Paraná	pt_BR
dc.rights	openAccess	pt_BR
dc.rights.uri	https://creativecommons.org/licenses/by-nc-sa/4.0	pt_BR
dc.subject	Processamento de linguagem natural (Computação)	pt_BR
dc.subject	Sites da Web - Avaliação e classificação	pt_BR
dc.subject	Redes sociais	pt_BR
dc.subject	Aplicativos móveis	pt_BR
dc.subject	Natural language processing (Computer science)	pt_BR
dc.subject	Web sites - Ratings and rankings	pt_BR
dc.subject	Social networks	pt_BR
dc.subject	Mobile apps	pt_BR
dc.title	Análise de sentimentos em comentários de aplicativos comerciais	pt_BR
dc.title.alternative	Sentiment analysis in commercial application comnents	pt_BR
dc.type	bachelorThesis	pt_BR
dc.description.resumo	As avaliações de plataformas online frequentemente apresentam inconsistências entre o conteúdo textual e a classificação numérica atribuída pelos usuários, comprometendo a confiabilidade do sistema de avaliação. Este trabalho desenvolveu uma ferramenta de análise de sentimentos para classificar automaticamente avaliações em cinco classes de sentimento. Foram coletadas 3.000 avaliações de cinco aplicativos da categoria Compras na Google Play Store, as quais foram submetidas a processos de reanotação automática utilizando os modelos de linguagem GPT-4 e Gemini 2.5 Pro, além de filtragem com o modelo de análise de sentimentos LeIA, visando mitigar as discrepâncias existentes entre as avaliações textuais e suas classificações numéricas. Quatro arquiteturas Transformer foram avaliadas mediante fine-tuning: BERTimbau Base, BERTimbau Large, mBERT Base e XLM-RoBERTa Base, variando hiperparâmetros como batch size e learning rate, além da aplicação de técnicas de limpeza e padronização em conjunto com o ponderamento de classes. Os resultados demonstraram que a reanotação com Gemini 2.5 Pro foi o fator de maior impacto, proporcionando ganho médio de 47,2% no F1-score macro, enquanto a reanotação com GPT-4 resultou em ganho de 32,3%. A filtragem com LeIA mostrou-se eficaz apenas em datasets com maiores inconsistências. O modelo BERTimbau Base treinado com o dataset reanotado pelo Gemini 2.5 Pro foi selecionado para compor a ferramenta final, alcançando F1-score macro de 0,79. A ferramenta foi disponibilizada mediante uma API RESTful desenvolvida em FastAPI e uma aplicação front-end multiplataforma em Flutter, implantadas com Docker e Docker Compose. Os experimentos evidenciaram que a qualidade da anotação dos dados possui impacto direto e substancial no desempenho dos modelos, sendo mais relevante que ajustes de hiperparâmetros ou técnicas de filtragem	pt_BR
dc.degree.local	Santa Helena	pt_BR
dc.publisher.local	Santa Helena	pt_BR
dc.contributor.advisor1	Brilhador, Anderson	-
dc.contributor.advisor-co1	Conti, Giuvane	-
dc.contributor.referee1	Brilhador, Anderson	-
dc.contributor.referee2	Ito, Giani Carla	-
dc.contributor.referee3	Rezende, Leiliane Pereira de	-
dc.publisher.country	Brasil	pt_BR
dc.publisher.program	Ciência da Computação	pt_BR
dc.publisher.initials	UTFPR	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	pt_BR
Aparece nas coleções:	SH - Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
analisesentimentosaplicativoscomercias.pdf		3,31 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons