Aprendizado contrastivo para a classificação de espécimes de herbário da família Piperaceae

Vieira, Alisson da Silva

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/39949

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Vieira, Alisson da Silva	-
dc.date.accessioned	2026-04-02T14:13:24Z	-
dc.date.available	2026-04-02T14:13:24Z	-
dc.date.issued	2025-11-19	-
dc.identifier.citation	VIEIRA, Alisson da Silva. Aprendizado contrastivo para a classificação de espécimes de herbário da família Piperaceae. 2025. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2025.	pt_BR
dc.identifier.uri	http://repositorio.utfpr.edu.br/jspui/handle/1/39949	-
dc.description.abstract	Herbaria serve the function of documenting plant samples collected from nature, preserving them as exsiccatae: dried specimens mounted on cardstock, accompanied by detailed descriptions. These specimens are essential for taxonomic, biogeographical, and ecological studies, but they require proper identification. Typically, identification constitutes a bottleneck in the herbarium workflow, as it is an arduous task, prone to errors, and highly dependent on the capacity and availability of specialists. Recently, initiatives to mitigate this problem have leveraged the images available in virtual herbaria to create and release datasets. These datasets are intended for training predictive models through Machine Learning, aiming to support experts in the identification task. However, the performance of these models has been unsatisfactory for many botanical families due to factors such as high inter-species similarity, significant intra-species variability, and, primarily, the long-tailed distribution of the datasets, in which many species are represented by few samples. This highly challenging scenario is exemplified by the dataset of the Piperaceae Giseke family, where the performance achieved is still insufficient to effectively assist specialists. To address this issue, this research aims to investigate the use of Contrastive Learning to enhance the automated identification of species in herbaria, with a specific focus on the species of the Piperaceae family. In general, Contrastive Learning aims to structure a representation space by pulling similar samples closer while simultaneously pushing dissimilar ones apart. To evaluate this approach, a series of experiments is proposed using samples from the botanical family Piperaceae Giseke. The contrastive approach, specifically SimCLRv2 framework, demonstrated strong performance, achieving a peak F1-Score of 0.62. This result surpasses the traditional baseline by 26 percentage points. Moreover, the findings highlight the data efficiency of Contrastive Learning, it surpassed the fully-trained traditional model’s performance while using only 15% of the labeled data. These results validate Contrastive Learning as a robust and high-impact strategy for automated species classification.	pt_BR
dc.description.sponsorship	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Tecnológica Federal do Paraná	pt_BR
dc.rights	openAccess	pt_BR
dc.rights.uri	https://creativecommons.org/licenses/by/4.0/	pt_BR
dc.subject	Processamento de imagens - Técnicas digitais	pt_BR
dc.subject	Aprendizado do computador	pt_BR
dc.subject	Herbários	pt_BR
dc.subject	Image processing - Digital techniques	pt_BR
dc.subject	Machine learning	pt_BR
dc.subject	Herbaria	pt_BR
dc.title	Aprendizado contrastivo para a classificação de espécimes de herbário da família Piperaceae	pt_BR
dc.title.alternative	Contrastive learning for the classification of herbarium specimens of the Piperaceae family	pt_BR
dc.type	masterThesis	pt_BR
dc.description.resumo	Os herbários têm a função de registrar amostras de plantas coletadas na natureza, preservando-as como exsicatas, amostras secas fixadas em cartolinas, acompanhadas de descrições detalhadas. Essas amostras são essenciais para estudos taxonômicos, biogeográficos e ecológicos, mas precisam ser adequadamente identificadas. Normalmente, a identificação constitui um gargalo no fluxo de trabalho dos herbários, pois é uma tarefa custosa, propensa a erros e altamente dependente da capacidade e da disponibilidade dos especialistas. Recentemente, iniciativas para mitigar esse problema têm empregado imagens disponíveis em herbários virtuais para criar e disponibilizar conjuntos de dados. Esses conjuntos são destinados ao treinamento de modelos preditivos por meio de Aprendizagem de Máquina, visando apoiar os especialistas na tarefa de identificação. Entretanto, o desempenho desses modelos não tem sido satisfatório para muitas famílias botânicas devido a fatores como a alta similaridade interespécies, a grande variabilidade intraespécies e, principalmente, à distribuição de cauda longa dos conjuntos de dados, na qual muitas espécies apresentam poucas amostras. Este cenário de alta dificuldade é encontrado no conjunto de dados da família Piperaceae Giseke, em que os resultados obtidos ainda não são suficientes para auxiliar os especialistas. Em busca de uma abordagem mais robusta, o objetivo desta pesquisa é investigar o uso da Aprendizagem Contrastiva para aprimorar a identificação automatizada de espécies em herbários, em específico, na identificação de espécies da família Piperaceae. De modo geral, a Aprendizagem Contrastiva busca, em um espaço de representações, aproximar amostras semelhantes, enquanto, simultaneamente, separa aquelas que são distintas. Para a avaliação dessa abordagem, realizou-se uma série de experimentos utilizando amostras da família botânica Piperaceae Giseke. A abordagem contrastiva, especificamente o framework SimCLRv2, demonstrou bons resultados, registrando 0,62 de F1-Score com os melhores hiperparâmetros encontrados. Os resultados obtidos superam a abordagem tradicional em 26 pontos percentuais. Mais importante, os resultados destacaram a eficiência da Aprendizagem Contrastiva, que, utilizando apenas 15% dos rótulos, foi capaz de superar a abordagem tradicional utilizando 100% dos dados rotulados. Os resultados validam a Aprendizagem Contrastiva como uma estratégia robusta e de alto impacto para a classificação automatizada de espécies.	pt_BR
dc.degree.local	Campo Mourão	pt_BR
dc.publisher.local	Campo Mourao	pt_BR
dc.creator.ID	https://orcid.org/0000-0001-9552-8526	pt_BR
dc.creator.Lattes	https://lattes.cnpq.br/3717930733224739	pt_BR
dc.contributor.advisor1	Schwerz, André Luís	-
dc.contributor.advisor1ID	https://orcid.org/0000-0002-8328-7144	pt_BR
dc.contributor.advisor1Lattes	https://lattes.cnpq.br/4954414332524750	pt_BR
dc.contributor.advisor-co1	Gonçalves, Diego Bertolini	-
dc.contributor.advisor-co1ID	https://orcid.org/0000-0002-6196-4538	pt_BR
dc.contributor.advisor-co1Lattes	https://lattes.cnpq.br/2264701855770284	pt_BR
dc.contributor.referee1	Hochuli, Andre Gustavo	-
dc.contributor.referee1ID	https://orcid.org/0000-0003-0190-547X	pt_BR
dc.contributor.referee1Lattes	https://lattes.cnpq.br/0929607475088739	pt_BR
dc.contributor.referee2	Foleis, Juliano Henrique	-
dc.contributor.referee2ID	https://orcid.org/0000-0003-2540-1145	pt_BR
dc.contributor.referee2Lattes	https://lattes.cnpq.br/4404958951175349	pt_BR
dc.contributor.referee3	Schwerz, André Luís	-
dc.contributor.referee3ID	https://orcid.org/0000-0002-8328-7144	pt_BR
dc.contributor.referee3Lattes	http://lattes.cnpq.br/4954414332524750	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Ciência da Computação	pt_BR
dc.publisher.initials	UTFPR	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	pt_BR
dc.subject.capes	Ciência da Computação	pt_BR
Aparece nas coleções:	CM - Programa de Pós-Graduação em Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
aprendizadocontrastivoespecimesherbario.pdf		2,5 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons