Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/33069
Título: SIRA: arquitetura para recuperação de informação sem servidor
Título(s) alternativo(s): SIRA: serverless information retrieval architecture
Autor(es): Rodrigues, Thiago Luiz
Orientador(es): Vendramin, Ana Cristina Barreiras Kochem
Palavras-chave: Sistemas operacionais distribuídos (Computadores)
Recuperação da informação
Indexação
Classificação
Algorítmos computacionais
Computação em nuvem
Processamento de linguagem natural (Computação)
Distributed operating systems (Computers)
Information retrieval
Indexing
Classification
Computer algorithms
Cloud computing
Natural language processing (Computer science)
Data do documento: 24-Nov-2023
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: RODRIGUES, Thiago Luiz. SIRA: arquitetura para recuperação de informação sem servidor. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023.
Resumo: A crescente necessidade de sistemas de recuperação de informação eficientes e escaláveis impulsionou a busca por novas abordagens e arquiteturas. Este trabalho propõe a arquitetura SIRA (Serverless Information Retrieval Architecture) para a recuperação de informação sobre a plataforma de computação sem servidor, com foco nas etapas de indexação, busca e classificação. A arquitetura é dividida em duas etapas: a indexação de documentos, que inclui o processamento, extração de métricas e criação de índices invertidos; e a recuperação de documentos, a qual envolve a busca de documentos relevantes, classificação dos documentos através de métricas e a apresentação dos resultados ao usuário. O desempenho da arquitetura SIRA é comparado com o ELS (Elastic Search) em duas coleções de teste, Cranfield e TRECCOVID. Além de ter a vantagem de consumir recursos apenas sob demanda, a arquitetura SIRA demonstrou um desempenho similar ao ELS, indicando sua eficácia na recuperação de documentos relevantes e seu potencial como uma solução no campo da recuperação da informação.
Abstract: The growing need for efficient and scalable information retrieval systems has driven the search for new approaches and architectures. This work proposes the Serverless Information Retrieval Architecture (SIRA) for information retrieval on the serverless computing platform, focusing on the stages of indexing, searching, and classification. The architecture is divided into two steps: document indexing, which includes processing, metric extraction, and the creation of inverted indexes; and document retrieval, which involves searching for relevant documents, classifying the documents through metrics, and presenting the results to the user. The performance of the SIRA architecture is compared to Elastic Search (ELS) on two test collections, Cranfield and TREC-COVID. In addition to having the advantage of consuming resources only on demand, the SIRA architecture demonstrated similar performance to ELS, indicating its effectiveness in retrieving relevant documents and its potential as a solution in the field of information retrieval.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/33069
Aparece nas coleções:CT - Programa de Pós-Graduação em Computação Aplicada

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
arquiteturarecuperacaoinformacaoservidor2024.pdf999,85 kBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons