Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/31850
Registro completo de metadados
Campo DCValorIdioma
dc.creatorBertucini, Otávio Thomas-
dc.date.accessioned2023-07-20T20:08:20Z-
dc.date.available2023-07-20T20:08:20Z-
dc.date.issued2022-12-05-
dc.identifier.citationBERTUCINI, Otávio Thomas. Garantindo a qualidade de dados na fusão de dados semânticos: um caso de uso de SHACL em dados de mobilidade e educação. 2022. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2022.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/31850-
dc.description.abstractAn important factor for the quality of knowledge gained from the data is the amount of data available for analysis and therefore it is ideal that data sets grow and become more useful over time. However, just increasing the number of available data without worrying about quality does not make the data more useful to the user and may even end up rendering the set unusable. When merging two or more semantic datasets, incorrect or incoherent data can be merged, causing the loss of quality of the set as a whole. The dimensions of quality, conciseness, consistency, and accuracy are important to ensure the integrity and veracity of the dataset, and the concept of ontology-based data management (OBDM) can help to ensure that these characteristics are present in datasets that grow over time. Of time. This work aims to create a mechanism that allows these three dimensions of quality to be measured, seeking to provide resources for people who want to increase the number of data to understand whether the data sets used have quality. The mechanism was built in the SHACL language and tested on a set of semantic data from the urban mobility and education domain. A script in Python was also created that allows the execution of this mechanism in a dataset.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/pt_BR
dc.subjectOWL (Linguagem da Ontologia Web)pt_BR
dc.subjectWeb semânticapt_BR
dc.subjectBanco de dados - Gerênciapt_BR
dc.subjectEstruturas de dados (Computação)pt_BR
dc.subjectOWL (Web ontology language)pt_BR
dc.subjectSemantic webpt_BR
dc.subjectData base managementpt_BR
dc.subjectData structures (Computer science)pt_BR
dc.titleGarantindo a qualidade de dados na fusão de dados semânticos: um caso de uso de SHACL em dados de mobilidade e educaçãopt_BR
dc.title.alternativeEnsuring data quality in semantic data fusion: a use case for SHACL in mobility and education datapt_BR
dc.typebachelorThesispt_BR
dc.description.resumoPara se obter análises completas e confiáveis através dos dados a quantidade de dados disponível é um fator muito importante é ideal que conjuntos de dados cresçam e se tornem mais úteis ao longo do tempo. No entanto, apenas aumentar a quantidade de dados disponíveis sem se preocupar a qualidade não torna os dados mais proveitosos para o usuário e pode até mesmo acabar deixando o conjunto inutilizável. Ao fundir dois ou mais conjuntos de dados, registros incorretos ou incoerentes podem ser fundidos, causando a perda de qualidade do conjunto como um todo. As dimensões de qualidade concisão, consistência e precisão são importantes para garantir a integridade e veracidade do conjunto de dados e o conceito de gerenciamento de dados baseado em ontologias (GDBO) pode ajudar para que estas características estejam presentes em conjuntos de dados que crescem ao longo do tempo. Este trabalho tem como objetivo criar um mecanismo de verificação da dimensões de qualidade de acurácia, consistência e concisão ao fundir conjuntos de dados ligados, permitindo que essas três dimensões de qualidade sejam aferidas e buscando oferecer mecanismos para pessoas que queiram aumentar o quantidade de dados possam entender se os conjuntos de dados utilizados têm qualidade. O mecanismo de verificação foi construído na linguagem SHACL (Shapes Constraint Language) e testado em um conjunto de dados semânticos do domínio de mobilidade urbana e educação. Também foi criado um script em Python que permite a execução deste mecanismo em conjunto de dados.pt_BR
dc.degree.localCuritibapt_BR
dc.publisher.localCuritibapt_BR
dc.contributor.advisor1Berardi, Rita Cristina Galarraga-
dc.contributor.referee1Berardi, Rita Cristina Galarraga-
dc.contributor.referee2Gomes Junior, Luiz Celso-
dc.contributor.referee3Teixeira, Heloise Manica Paris-
dc.publisher.countryBrasilpt_BR
dc.publisher.programSistemas de Informaçãopt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAOpt_BR
Aparece nas coleções:CT - Sistemas de Informação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
qualidadefusaodadossemanticos.pdf7,32 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons