Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/28990
Título: Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais
Título(s) alternativo(s): Tools for geographic contextualization of outliers in multidimensional datasets
Autor(es): Freitas, Lucas Kaminski de
Orientador(es): Gomes Junior, Luiz Celso
Palavras-chave: Armazenamento de dados
Mineração de dados (Computação)
Sistemas de informação geográfica
Banco de dados geográficos
Visualização da informação
Data Warehousing
Data mining
Geographic information systems
Geodatabases
Information visualization
Data do documento: 7-Dez-2021
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: FREITAS, Lucas Kaminski de. Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2021.
Resumo: A análise, contextualização e compreensão de outliers em datasets complexos, com muitos atributos heterogêneos, apresenta grandes desafios. Para o especialista realizando a análise, nem sempre é trivial identificar quais dados e atributos são relevantes para o problema em questão, mesmo com a utilização de técnicas de visualização de dados. Este problema é ainda mais desafiador em datasets que demandam a interpretação geográfica de outliers, como por exemplo: (i) dados meteorológicos; (ii) dados de censos demográficos; (iii) dados socioeconômicos de diversos municípios. Este trabalho tem como objetivo propor ferramentas que simplifiquem a tarefa de interpretação e contextualização geográfica de outliers, através de visualizações criadas com o auxílio de algoritmos de Outlying Aspect Mining. Com essas ferramentas, pretende-se propiciar análises mais precisas, diretas e eficientes, permitindo que o especialista compreenda e contextualize os outliers com mais facilidade, sob uma perspectiva geográfica. Como caso de teste, serão utilizados os dados públicos de vacinação contra a Covid-19 no Brasil, disponibilizados pelo OpenDataSus.
Abstract: Analyzing, contextualizing, and understanding outliers in complex datasets, with many heterogeneous attributes, presents big challenges. For the specialist performing the analysis, it is not always trivial to identify which attributes are relevant to the problem at hand, even with the usage of data visualization techniques. This problem is even more challenging in datasets that demand the geographic interpretation of outliers, such as (i) meteorological data; (ii) demographic census data; (iii) socio-economic data from several cities. The present work proposes tools for simplifying the task of geographic contextualization and interpretation of outliers, through visualizations generated with the help of Outlying Aspect Mining algorithms. With these tools, it is expected that more accurate, direct, and efficient analyses are possible, allowing the specialist to understand and contextualize outliers more easily, from a geographic perspective. As a test case, public data on vaccination against Covid-19 in Brazil, made available by OpenDataSus, will be used.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/28990
Aparece nas coleções:CT - Engenharia de Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
outliers.pdf1,36 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons