Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/40266Registro completo de metadados
| Campo DC | Valor | Idioma |
|---|---|---|
| dc.creator | Ávila Buitrón, Martín | - |
| dc.date.accessioned | 2026-04-27T12:40:34Z | - |
| dc.date.available | 2026-04-27T12:40:34Z | - |
| dc.date.issued | 2025-12-04 | - |
| dc.identifier.citation | Ávila Buitrón, Martín. Identificação de temas emergentes em notícias através de métodos não-supervisionados. 2025.Trabalho de Conclusão de Curso (Engenharia da Computação) - Universidade Tecnológica Federal do Paraná, Toledo, 2025. | pt_BR |
| dc.identifier.uri | http://repositorio.utfpr.edu.br/jspui/handle/1/40266 | - |
| dc.description.abstract | Novelty Detection in documents is a challenging task of great relevance today. The literature addresses this problem through different approaches, using supervised learning, unsupervised learning, self-supervised learning, among others. This topic is especially significant in the field of Natural Language Processing, as the goal is to differentiate texts belonging to a known set from those bringing new or emerging information. In this work, we propose to investigate different unsupervised models for novelty detection in a news dataset, with the objective of comparing them with supervised models. Models such as Local Outlier Factor, Isolation Forest, and Elliptic Envelope were evaluated, along with a modern approach based on the RAG architecture with Large Language Models, comparing them with baselines established in the literature. The metrics used include precision, recall, F1-score, and accuracy. The results demonstrated that the Local Outlier Factor model achieved promising performance, with an F1 of 80.90% and accuracy of 85.80%, compared to state-of-the-art baselines. | pt_BR |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Tecnológica Federal do Paraná | pt_BR |
| dc.rights | openAccess | pt_BR |
| dc.rights.uri | https://creativecommons.org/licenses/by/4.0/deed.en | pt_BR |
| dc.subject | Processamento de linguagem natural (Computação) | pt_BR |
| dc.subject | Aprendizado do computador | pt_BR |
| dc.subject | Natural language processing (Computer science) | pt_BR |
| dc.subject | Machine learning | pt_BR |
| dc.title | Identificação de temas emergentes em notícias através de métodos não-supervisionados | pt_BR |
| dc.title.alternative | Detection of emerging topics in news through unsupervised learning models | pt_BR |
| dc.type | bachelorThesis | pt_BR |
| dc.description.resumo | A Novelty Detection, ou detecção de novidade em documentos, é uma tarefa desafiadora e de grande relevância na atualidade. A literatura trata este problema sob distintas abordagens, utilizando aprendizado supervisionado, não supervisionado, autosupervisionado, entre outros. Este tema é especialmente significativo no campo do Processamento de Linguagem Natural, visto que o intuito é diferenciar textos que pertencem a um conjunto já conhecido daqueles que trazem informações inéditas ou emergentes. Neste trabalho, propõe-se investigar distintos métodos não supervisionados de detecção de novidade em um conjunto de dados de notícias, com o objetivo de compará-los com métodos supervisionados. Foram avaliados métodos como Local Outlier Factor, Isolation Forest e Elliptic Envelope, e uma abordagem moderna baseada na arquitetura RAG com modelos de linguagem de grande escala, comparando-os com baselines estabelecidos na literatura. As métricas utilizadas incluem precisão, recall, F1-score e acurácia. Os resultados demonstraram que o método LOF alcançou desempenho promissor, com F1 de 80,90% e acurácia de 85,80%, em comparação com os baselines do estado da arte. | pt_BR |
| dc.degree.local | Toledo | pt_BR |
| dc.publisher.local | Toledo | pt_BR |
| dc.contributor.advisor1 | Paetzold, Gustavo Henrique | - |
| dc.contributor.referee1 | Paetzold, Gustavo Henrique | - |
| dc.contributor.referee2 | Jeronymo, Daniel Cavalcanti | - |
| dc.contributor.referee3 | Souza, Álvaro Ricieri Castro e | - |
| dc.contributor.referee4 | Ensina, Leandro Augusto | - |
| dc.publisher.country | Brasil | pt_BR |
| dc.publisher.program | Engenharia de Computação | pt_BR |
| dc.publisher.initials | UTFPR | pt_BR |
| dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA | pt_BR |
| Aparece nas coleções: | TD - Engenharia de Computação | |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| identificacaotemasemergentesnoticias.pdf | 2,27 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons
