Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/31868
Título: Desenvolvimento de um modelo de representação temporal para coleções de documentos
Título(s) alternativo(s): Development of a temporal representation model for document collections
Autor(es): Nascimento, João Victor
Orientador(es): Alencar, Aretha Barbosa
Palavras-chave: Mineração de dados (Computação)
Documentos eletrônicos
Publicações eletrônicas acadêmicas
Análise de séries temporais
Data mining
Electronic records
Scholarly electronic publishing
Time-series analysis
Data do documento: 17-Nov-2021
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Campo Mourao
Citação: NASCIMENTO, João Victor. Desenvolvimento de um modelo de representação temporal para coleções de documentos. 2021. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2021.
Resumo: Este trabalho visa apresentar o desenvolvimento de um novo modelo de representação vetorial para coleções de documentos, que capte o aspecto temporal da variação da ocorrência dos termos ao longo do tempo. Como prova de conceito, esse novo modelo de representação vetorial temporal foi incluído no arcabouço visual interativo ScienceView, que tem como uma das funcionalidades, gerar projeções multidimensionais dinâmicas de coleções de artigos científicos. As coleções de artigos científicos evoluem temporalmente, desta forma é possível extrair o aspecto temporal, e utilizando-o para melhorar as análises aplicadas sobre as projeções. A importância dos termos foi mensurada de forma dinâmica, se baseando na variação da ocorrência do termo ao tempo, pela extração das séries temporais das ocorrências de cada termo na coleção de artigos científicos. O novo modelo desenvolvido foi experimentado em duas coleções de artigos científicos: a coleção de documentos CBR-ILP-IR, que apresenta artigos científicos de três áreas de pesquisa; e a base formada pelos artigos publicados pelo pesquisador Alessandro Vespiginiani. Desta forma, foi realizado um estudo comparativo, tanto com o modelo clássico já existente na ScienceView e o novo modelo temporal. Averiguando como a abordagem empregada pelo novo modelo de representação vetorial desenvolvido, performa sobre a projeção. Dado que a projeção utiliza um modelo de representação na sua geração, a avaliação é possível através de análises empíricas e numéricas sobre as projeções finais, inferindo indiretamente como o novo modelo de representação vetorial performa e impacta na projeção final.
Abstract: This work aims to present the development of a new vector representation model for document collections, which captures the temporal aspect of the variation in the occurrence of terms over time. As a proof of concept, this new temporal vector representation model was included in the interactive visual framework ScienceView , which has as one of its features to generate dynamic multidimensional projections of scientific articles collections. The collections of scientific articles evolve over time, thus it is possible to extract the temporal aspect, and using it to improve the analysis applied to the projections. The importance of the terms was dynamically measured, based on the variation in the occurrence of the term over time, by extracting the time series of the occurrences of each term in the collection of scientific articles. The new model developed was tested in two collections of scientific articles: the CBR-ILP-IR document collection, which presents scientific articles from three research areas; and the base formed by the articles published by the researcher Alessandro Vespiginiani. Thus, a comparative study was carried out, both with the classic model already existing in ScienceView and the new temporal model. Investigating how the approach employed by the new vector representation model developed performs on the projection. Since the projection uses a representation model in its generation, the evaluation is possible through empirical and numerical analysis on the final projections, indirectly inferring how the new vector representation model performs and impacts the final projection.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/31868
Aparece nas coleções:CM - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
modelorepresentacaotemporaldocumentos.pdf5,95 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons