Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/14606
Título: Consultas por similaridade em bases de dados complexos utilizando técnica OMNI em SGBDR
Título(s) alternativo(s): Similarity queries in complex databases using OMNI technique in RDBMS
Autor(es): Matsui, Cristiano José Mendes
Orientador(es): Pola, Ives Renê Venturini
Palavras-chave: Banco de dados
Sistemas de consultas e respostas
Otimização matemática
Data bases
Question-answering systems
Mathematical optimization
Data do documento: 6-Dez-2018
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Pato Branco
Citação: MATSUI, Cristiano José Mendes. Consultas por similaridade em bases de dados complexos utilizando técnica OMNI em SGBDR. 2018. 50 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2018.
Resumo: A necessidade de armazenamento de mídias cada vez maiores em termos de tamanho de armazenamento e complexas é uma tendência que aumentou consideravelmente com os avanços da tecnologia e comunicação. Estes dados conhecidos como dados complexos exigem uma complexidade estrutural de armazenamento e análise maior do que dados simples como palavras ou números, além de requererem operadores especiais de consultas, como a consulta por abrangência - range query (Rq) e a consulta aos k-vizinhos mais próximos - k-nearest neighbors query (kNNq). Dentre o conjunto de dados complexos destacam-se as imagens, que precisam ser comparadas de acordo com características extraídas como cor, forma ou textura. Esta comparação é realizada na forma de um cálculo de distância entre o valor da característica da imagem central da consulta em relação a todas as outras imagens da base de dados. O tempo de consulta aumenta significativamente com o aumento da base de dados e da complexidade destes. Para contornar o problema da maldição da dimensionalidade, este trabalho tem como proposta a aplicação da técnica OMNI utilizada para promover uma etapa de filtragem do número de imagens a terem as suas distâncias calculadas, evitando a comparação com toda a base de dados. Esta técnica possui custos adicionais de espaço de armazenamento para as suas estruturas, mas consegue acelerar consultas por similaridade, reduzindo o tempo de execução necessário.
Abstract: The necessity of storing evergrowing media in terms of storage size and complexity is a tendency that grew considerably with technology and comunication advances. These data known as complex data demand a much bigger structural storage and analysis complexity when compared with simple data such as words or numbers, besides requiring special queries operators, like Range query (Rq) and k-Nearest Neighbors query (kNNq). Among the complex data set the images are highlighted, which need to be compared using extracted features such as color, shape or texture. This comparison is done by distance calculations between the feature value of the central image of the query in relation to all the remaining images in the database. Query time increases significantly with the increase of database size and complexity. To work around the curse of dimensionality problem, this study proposes the application of the OMNI technique, used to promote a filtering step of the number of images to have their distances calculated, avoiding comparing with the entire database. This technique has additional storage costs for its structures, but can accelerate similarity queries, reducing required execution time.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/14606
Aparece nas coleções:PB - Engenharia de Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
PB_COENC_2018_2_04.pdf1,21 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.