Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/33069
Título: | SIRA: arquitetura para recuperação de informação sem servidor |
Título(s) alternativo(s): | SIRA: serverless information retrieval architecture |
Autor(es): | Rodrigues, Thiago Luiz |
Orientador(es): | Vendramin, Ana Cristina Barreiras Kochem |
Palavras-chave: | Sistemas operacionais distribuídos (Computadores) Recuperação da informação Indexação Classificação Algorítmos computacionais Computação em nuvem Processamento de linguagem natural (Computação) Distributed operating systems (Computers) Information retrieval Indexing Classification Computer algorithms Cloud computing Natural language processing (Computer science) |
Data do documento: | 24-Nov-2023 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Curitiba |
Citação: | RODRIGUES, Thiago Luiz. SIRA: arquitetura para recuperação de informação sem servidor. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023. |
Resumo: | A crescente necessidade de sistemas de recuperação de informação eficientes e escaláveis impulsionou a busca por novas abordagens e arquiteturas. Este trabalho propõe a arquitetura SIRA (Serverless Information Retrieval Architecture) para a recuperação de informação sobre a plataforma de computação sem servidor, com foco nas etapas de indexação, busca e classificação. A arquitetura é dividida em duas etapas: a indexação de documentos, que inclui o processamento, extração de métricas e criação de índices invertidos; e a recuperação de documentos, a qual envolve a busca de documentos relevantes, classificação dos documentos através de métricas e a apresentação dos resultados ao usuário. O desempenho da arquitetura SIRA é comparado com o ELS (Elastic Search) em duas coleções de teste, Cranfield e TRECCOVID. Além de ter a vantagem de consumir recursos apenas sob demanda, a arquitetura SIRA demonstrou um desempenho similar ao ELS, indicando sua eficácia na recuperação de documentos relevantes e seu potencial como uma solução no campo da recuperação da informação. |
Abstract: | The growing need for efficient and scalable information retrieval systems has driven the search for new approaches and architectures. This work proposes the Serverless Information Retrieval Architecture (SIRA) for information retrieval on the serverless computing platform, focusing on the stages of indexing, searching, and classification. The architecture is divided into two steps: document indexing, which includes processing, metric extraction, and the creation of inverted indexes; and document retrieval, which involves searching for relevant documents, classifying the documents through metrics, and presenting the results to the user. The performance of the SIRA architecture is compared to Elastic Search (ELS) on two test collections, Cranfield and TREC-COVID. In addition to having the advantage of consuming resources only on demand, the SIRA architecture demonstrated similar performance to ELS, indicating its effectiveness in retrieving relevant documents and its potential as a solution in the field of information retrieval. |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/33069 |
Aparece nas coleções: | CT - Programa de Pós-Graduação em Computação Aplicada |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
arquiteturarecuperacaoinformacaoservidor2024.pdf | 999,85 kB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons