Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/40283| Título: | Uma abordagem de mineração de textos para a melhoria da indexação de acervos de bibliotecas universitárias |
| Título(s) alternativo(s): | A text mining approach to improve collection indexing of university libraries |
| Autor(es): | Benin, Keli Rodrigues do Amaral |
| Orientador(es): | Teixeira, Marcelo |
| Palavras-chave: | Mineração de dados (Computação) Indexação Sistemas de suporte de decisão Data mining Indexing Decision support systems |
| Data do documento: | 21-Jun-2022 |
| Editor: | Universidade Tecnológica Federal do Paraná |
| Câmpus: | Dois Vizinhos |
| Citação: | BENIN, Keli Rodrigues do Amaral. Uma abordagem de mineração de textos para a melhoria da indexação de acervos de bibliotecas universitárias. 2022. Monografia (Especialização em Ciência de Dados) - Universidade Tecnológica Federal do Paraná, Dois Vizinhos, 2022 |
| Resumo: | No Sistema de Bibliotecas de instituições de ensino federais são frequentes o uso de vocabulários controlados, para indexação das obras. Porém, nesses vocabulários controlados, as palavras-chave são limitadas e desatualizadas muitas vezes, restringindo assim à representação temática das obras. Quando reduzimos essa representação temática das obras, passamos a ter a recuperação da informação ineficiente. Estima-se que, justamente por isso, poucos trabalhos de mineração de texto se apliquem diretamente sobre esse domínio. O presente trabalho tem como objetivo de verificar a aplicação da mineração de texto como ação de contribuição à tomada de decisão para os profissionais da informação, em relação a representação da informação no catálogo da biblioteca da Universidade Tecnológica Federal do Paraná (UTFPR). Constitui-se de um estudo exploratório, de natureza aplicada, que utiliza a técnica de pesquisa bibliográfica, com abordagem de coleta de dados qualitativa, e que adota a ferramenta de mineração de texto Orange Data Mining como instrumento para analisar os comentários definidos como mais úteis pelos usuários em dez livros (aleatórios) disponibilizados no ambiente de comércio eletrônico Amazon; em seguida definir as palavras-chave de cada obra e confrontá- las com os termos indexadores dos mesmos livros no catálogo da Biblioteca da UTFPR. Apresenta como resultados da pesquisa, que após o confronto, pode-se perceber que a maioria dos termos elencados pelo software, a partir da colaboração dos usuários nos comentários das obras no ambiente Amazon, não são adotadas como palavras-chave representativas dos assuntos de cada obra no catálogo da Biblioteca da UTFPR, entretanto, esses termos conseguem sintetizar em si o conteúdo dos livros, o que permite uma recuperação mais intuitiva. Também foi identificado que algumas obras foram indexadas no catálogo da Biblioteca da UTFPR com um único descritor, enquanto que a mineração resultou em três palavras quem representaram o conteúdo da respectiva obra, nos permitindo inferir que o conhecimento sobre o conteúdo da obra pode ser descoberto a partir de palavras identificadas na mineração de texto. Assim, compreendemos que: (i) consultar unicamente um instrumento dos Sistemas de Organização do Conhecimento (SOC’s), eventualmente, pode ser uma ação limitada no processo de decisão quanto aos termos representativos ao conteúdo da obra; (ii) a ferramenta de mineração de texto pode contribuir nesse domínio; (iii) ela pode ser utilizada por profissionais da informação que não possuem conhecimento aprofundado em Ciência de Dados. |
| Abstract: | In the Library System of federal educational institutions, controlled vocabularies are frequently used to index works. However, in these controlled vocabularies, the keywords are limited and often outdated, thus restricting the thematic representation of the works. When we reduce this thematic representation of the works, we start to have inefficient information retrieval. It is estimated that, precisely for this reason, few text mining works apply directly to this domain. The present work aims to verify the application of text mining as an action to contribute to decision making for information professionals, in relation to the representation of information in the library catalog of the Universidade Tecnológica Federal do Paraná (UTFPR). It is an exploratory study, of an applied nature, which uses the bibliographic research technique, with a qualitative data collection approach, and which adopts the Orange Data Mining text mining tool as an instrument to analyze the comments defined as most useful. by users in ten (random) books made available in the Amazon e-commerce environment; then define the keywords for each work and compare them with the indexing terms of the same books in the UTFPR Library catalog. After the comparison, it can be seen that most of the terms listed by the software, based on the wisdom of users in the comments of the works in the Amazon environment, are not adopted as keywords representing the subjects of each work in the UTFPR Library catalog, however these terms have the qualities (characteristics) of presenting the meanings regarding the content of the books, thus allowing a more intuitive retrieval. It was also identified that some works were indexed in the UTFPR Library catalog with a single descriptor, while the mining resulted in three words that represented the content of the respective work, allowing us to infer that knowledge about the content of the work can be discovered at from words identified in text mining. And thus, allowing us to understand that consulting only one instrument of the Knowledge Organization Systems (SOC's), eventually, can be a limited action in the decision process regarding the terms representing the content of the work. And that the text mining tool can contribute in this domain, and that it can be used by information professionals who do not have an in-depth knowledge of Data Science. |
| URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/40283 |
| Aparece nas coleções: | DV - Ciência de Dados |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| mineracaotextosmelhoriaindexacao.pdf | 1,37 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons
