Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/39384
Registro completo de metadados
Campo DCValorIdioma
dc.creatorTheisen, Lucas Evandro-
dc.date.accessioned2026-02-13T17:45:40Z-
dc.date.available2026-02-13T17:45:40Z-
dc.date.issued2025-12-01-
dc.identifier.citationTHEISEN, Lucas Evandro. Análise de sentimentos em comentários de aplicativos comerciais. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Santa Helena, 2025.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/39384-
dc.description.abstractOnline platform reviews frequently exhibit inconsistencies between textual content and numerical ratings assigned by users, compromising the reliability of the evaluation system. This work developed a sentiment analysis tool to automatically classify reviews into five sentiment classes. A total of 3,000 reviews were collected from five applications in the Shopping category on the Google Play Store, which were subjected to automatic re-annotation processes using the GPT-4 and Gemini 2.5 Pro language models, in addition to filtering with the LeIA sentiment analysis model, aiming to mitigate existing discrepancies between textual reviews and their numerical ratings. Four Transformer architectures were evaluated through fine-tuning: BERTimbau Base, BERTimbau Large, mBERT Base, and XLM-RoBERTa Base, varying hyperparameters such as batch size and learning rate, in addition to applying data cleaning and standardization techniques together with class weighting. The results demonstrated that re-annotation with Gemini 2.5 Pro was the most impactful factor, providing an average gain of 47.2% in macro F1-score, while re-annotation with GPT-4 resulted in a gain of 32.3%. Filtering with LeIA proved effective only in datasets with greater inconsistencies. The BERTimbau Base model trained with the dataset re-annotated by Gemini 2.5 Pro was selected to compose the final tool, achieving a macro F1-score of 0.79. The tool was made available through a RESTful API developed in FastAPI and a multiplatform front-end application in Flutter, deployed with Docker and Docker Compose. The experiments showed that data annotation quality has a direct and substantial impact on model performance, being more relevant than hyperparameter adjustments or filtering techniques.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0pt_BR
dc.subjectProcessamento de linguagem natural (Computação)pt_BR
dc.subjectSites da Web - Avaliação e classificaçãopt_BR
dc.subjectRedes sociaispt_BR
dc.subjectAplicativos móveispt_BR
dc.subjectNatural language processing (Computer science)pt_BR
dc.subjectWeb sites - Ratings and rankingspt_BR
dc.subjectSocial networkspt_BR
dc.subjectMobile appspt_BR
dc.titleAnálise de sentimentos em comentários de aplicativos comerciaispt_BR
dc.title.alternativeSentiment analysis in commercial application comnentspt_BR
dc.typebachelorThesispt_BR
dc.description.resumoAs avaliações de plataformas online frequentemente apresentam inconsistências entre o conteúdo textual e a classificação numérica atribuída pelos usuários, comprometendo a confiabilidade do sistema de avaliação. Este trabalho desenvolveu uma ferramenta de análise de sentimentos para classificar automaticamente avaliações em cinco classes de sentimento. Foram coletadas 3.000 avaliações de cinco aplicativos da categoria Compras na Google Play Store, as quais foram submetidas a processos de reanotação automática utilizando os modelos de linguagem GPT-4 e Gemini 2.5 Pro, além de filtragem com o modelo de análise de sentimentos LeIA, visando mitigar as discrepâncias existentes entre as avaliações textuais e suas classificações numéricas. Quatro arquiteturas Transformer foram avaliadas mediante fine-tuning: BERTimbau Base, BERTimbau Large, mBERT Base e XLM-RoBERTa Base, variando hiperparâmetros como batch size e learning rate, além da aplicação de técnicas de limpeza e padronização em conjunto com o ponderamento de classes. Os resultados demonstraram que a reanotação com Gemini 2.5 Pro foi o fator de maior impacto, proporcionando ganho médio de 47,2% no F1-score macro, enquanto a reanotação com GPT-4 resultou em ganho de 32,3%. A filtragem com LeIA mostrou-se eficaz apenas em datasets com maiores inconsistências. O modelo BERTimbau Base treinado com o dataset reanotado pelo Gemini 2.5 Pro foi selecionado para compor a ferramenta final, alcançando F1-score macro de 0,79. A ferramenta foi disponibilizada mediante uma API RESTful desenvolvida em FastAPI e uma aplicação front-end multiplataforma em Flutter, implantadas com Docker e Docker Compose. Os experimentos evidenciaram que a qualidade da anotação dos dados possui impacto direto e substancial no desempenho dos modelos, sendo mais relevante que ajustes de hiperparâmetros ou técnicas de filtragempt_BR
dc.degree.localSanta Helenapt_BR
dc.publisher.localSanta Helenapt_BR
dc.contributor.advisor1Brilhador, Anderson-
dc.contributor.advisor-co1Conti, Giuvane-
dc.contributor.referee1Brilhador, Anderson-
dc.contributor.referee2Ito, Giani Carla-
dc.contributor.referee3Rezende, Leiliane Pereira de-
dc.publisher.countryBrasilpt_BR
dc.publisher.programCiência da Computaçãopt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
Aparece nas coleções:SH - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
analisesentimentosaplicativoscomercias.pdf3,31 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons