Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/40261
Título: Contribuições para a melhoria da integridade dos dados no herbário HCF-Web: deduplicação, correção de inconsistências e transição tecnológica para PostgreSQL
Título(s) alternativo(s): Contributions to improving data integrity in the HCF-Web herbarium: deduplication, correction of inconsistencies, and technological transition to PostgreSQL
Autor(es): Ribeiro, Vitor Hugo Melo
Orientador(es): Schwerz, André Luís
Palavras-chave: Herbários
Banco de dados
PostgreSQL (Linguagem de programação de computador)
Herbaria
Data bases
PostgreSQL
Data do documento: 8-Dez-2025
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Campo Mourao
Citação: RIBEIRO, Vitor Hugo Melo. Contribuições para a melhoria da integridade dos dados no herbário HCF-Web: deduplicação, correção de inconsistências e transição tecnológica para PostgreSQL. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2025.
Resumo: A evolução contínua do sistema HCF-Web, desenvolvido para o gerenciamento da coleção do Herbário do Centro Federal (HCF) da Universidade Tecnológica Federal do Paraná, Campus Campo Mourão (UTFPR-CM), evidenciou a necessidade de aprofundamento nas etapas de saneamento, validação e modernização da base de dados já existente. Após a entrada do sistema em produção com banco de dados MySQL, inconsistências nos dados migrados passaram a ser identificadas a partir do uso real da aplicação, demandando correções estruturais e ajustes diretamente no ambiente produtivo. Este trabalho tem como objetivo documentar e implementar um conjunto de intervenções técnicas voltadas à melhoria da qualidade, consistência e escalabilidade dos dados do HCF-Web. Entre as atividades realizadas, destacam-se a identificação e correção de registros defeituosos provenientes do processo de migração do banco Firebird, a padronização e normalização de entidades fundamentais como locais de coleta, coletores e identificadores taxonômicos, além da adição e população de campos semânticos importantes, como a classificação de exsicatas unicatas e duplicatas. Adicionalmente, foi conduzida a higienização da base de dados em produção, com a remoção de duplicidades e o reforço da integridade referencial entre as tabelas, garantindo maior confiabilidade às informações armazenadas. Paralelamente, ocorreram melhorias funcionais no sistema, incluindo ajustes na exibição de imagens das exsicatas e adequações no frontend e backend para suportar novos padrões de dados. Como etapa final, o trabalho contemplou a migração tecnológica do banco de dados MySQL para PostgreSQL, utilizando a ferramenta pgloader com definição criteriosa de regras de conversão (casts) para assegurar a fidelidade dos dados. Essa migração foi validada quantitativamente e acompanhada da adaptação das camadas de aplicação, permitindo a criação de um ambiente de testes funcional. A adoção do PostgreSQL viabiliza o uso da extensão PostGIS, abrindo possibilidades para futuras funcionalidades baseadas em dados geoespaciais, como a análise de coordenadas de coleta e identificação automática de localidades. Os resultados alcançados consolidam uma base de dados mais robusta, consistente e preparada para expansão, contribuindo de forma significativa para a sustentabilidade tecnológica e evolução do sistema HCF-Web.
Abstract: The continuous evolution of the HCF-Web system, developed for managing the collection of the Herbário do Centro Federal (HCF) at the Universidade Tecnológica Federal do Paraná, Campus Campo Mourão (UTFPR-CM), highlighted the need to deepen the processes of data cleansing, validation, and modernization of the existing database. After the system entered production using a MySQL database, inconsistencies in the migrated data began to be identified through real-world use of the application, requiring structural corrections and direct adjustments in the production environment. This work aims to document and implement a set of technical interventions focused on improving the quality, consistency, and scalability of the data in HCF-Web. Among the activities carried out are the identification and correction of defective records originating from the Firebird database migration process, the standardization and normalization of fundamental entities such as collection sites, collectors, and taxonomic identifiers, as well as the addition and population of important semantic fields, such as the classification of exsiccatae as unique or duplicate. Additionally, a data cleansing process was conducted in the production database, with the removal of duplicates and the reinforcement of referential integrity among tables, ensuring greater reliability of the stored information. In parallel, functional improvements were made to the system, including adjustments to the display of exsiccatae images and updates to both the frontend and backend to support new data standards. As a final stage, the work included the technological migration of the database from MySQL to PostgreSQL, using the pgloader tool with carefully defined conversion rules (casts) to ensure data fidelity. This migration was quantitatively validated and accompanied by the adaptation of the application layers, enabling the creation of a functional testing environment. The adoption of PostgreSQL enables the use of the PostGIS extension, opening possibilities for future features based on geospatial data, such as the analysis of collection coordinates and automatic identification of locations. The achieved results consolidate a more robust, consistent, and scalable database, significantly contributing to the technological sustainability and further evolution of the HCF-Web system.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/40261
Aparece nas coleções:CM - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
contribuicoeshcfwebpostgresql.pdf93,82 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.