Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/35302
Registro completo de metadados
Campo DCValorIdioma
dc.creatorMendes, Felipe Archanjo da Cunha-
dc.date.accessioned2024-10-31T21:25:24Z-
dc.date.available2024-10-31T21:25:24Z-
dc.date.issued2024-08-12-
dc.identifier.citationMENDES, Felipe Archanjo da Cunha. Classificação de pássaros por meio de cantos e chamados: uma abordagem integrada com espectrogramas em conjunto com descritores handcrafted e transfer learning. 2024. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2024.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/35302-
dc.description.abstractThe classification of bird species is an important task in environmental monitoring and conservation. This study aimed to develop a machine-learning model to classify bird species based on their songs and calls. Initially, spectrograms were generated for each recording available in the database. Subsequently, a strategy of dividing these spectrograms into smaller segments, called patches, was adopted to investigate the influence of this approach on the model’s performance. Various feature extraction techniques were explored, including handcrafted descriptors such as LBP and Gabor Filters, and descriptors derived from Transfer Learning models, such as VGG16, ResNet50, DenseNet121, and MobileNet. This process used sets with two, three, five, and ten classes to analyze the outcome behavior as this subset gradually increased. Additionally, experiments using the SVM classifier were conducted to evaluate the accuracy and effectiveness of the model. The results revealed that the descriptors based on Transfer Learning showed superior performance, with particular emphasis on ResNet50, which achieved an F1 score of 0.8994 in classifying two birds with the spectrogram divided into three patches. Other models, such as DenseNet121 and MobileNet, also showed competitive results in the same configuration with two birds: DenseNet121 achieved an F1 score of 0.8992 using just one patch. In contrast, MobileNet scored 0.8989 with three patches. These findings suggest that dividing the spectrograms into patches, combined with advanced feature extraction techniques, can effectively classify bird species based on their songs and calls. The results also show that classification performance drops sharply as the number of species increases.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/*
dc.subjectPercepção de padrõespt_BR
dc.subjectAprendizado do computadorpt_BR
dc.subjectOrnitologiapt_BR
dc.subjectCanto dos pássarospt_BR
dc.subjectPattern perceptionpt_BR
dc.subjectMachine learningpt_BR
dc.subjectOrnithologypt_BR
dc.subjectBirdsongspt_BR
dc.titleClassificação de pássaros por meio de cantos e chamados: uma abordagem integrada com espectrogramas em conjunto com descritores handcrafted e transfer learningpt_BR
dc.title.alternativeBird classification through songs and calls: an integrated approach with spectrograms in conjunction with handcrafted descriptors and transfer learningpt_BR
dc.typebachelorThesispt_BR
dc.description.resumoA classificação de espécies de pássaros é uma tarefa importante no monitoramento e conservação do meio ambiente. Neste estudo, o objetivo foi desenvolver um modelo de aprendizado de máquina destinado a classificar distintas espécies de pássaros com base em seus cantos e chamados. Inicialmente, espectrogramas foram gerados para cada gravação disponível no banco de dados. Posteriormente, adotou-se uma estratégia de divisão desses espectrogramas em segmentos menores, denominados patches, para investigar a influência dessa abordagem no desempenho do modelo. Diversas técnicas de extração de características foram exploradas, incluindo descritores handcrafted, como o Local Binary Pattern (LBP) e Filtros Gabor, e descritores derivados de modelos de Transfer Learning, tais como VGG16, ResNet50, DenseNet121 e MobileNet. Esse processo foi realizado utilizando conjuntos de duas, três, cinco e dez classes, com o objetivo de analisar o comportamento do resultado conforme o número de classes aumenta. Além disso, foram conduzidos experimentos utilizando o classificador Support Vector Machine (SVM) para avaliar a precisão e eficácia do modelo. Os resultados revelaram que os descritores baseados em Transfer Learning apresentaram desempenho superior, com destaque para o Resnet50, que obteve uma pontuação F1 de 0,8994 na classificação entre duas espécies de pássaros, com o espectrograma dividido em três patches. Outros modelos, como o DenseNet121 e o MobileNet, também mostraram resultados competitivos na mesma configuração com dois pássaros: o DenseNet121 atingiu uma pontuação F1 de 0,8992 utilizando apenas um patch, enquanto o MobileNet registrou uma pontuação de 0,8989 com três patches. Esses achados sugerem que a abordagem de divisão dos espectrogramas em patches, combinada com técnicas extração de características baseadas em transfer-learning, podem ser eficazes para a classificação de espécies de pássaros baseada em seus cantos e chamados. Os resultados também mostraram que conforme o número de espécies aumenta, as taxas de classificação caem rapidamente.pt_BR
dc.degree.localCampo Mourãopt_BR
dc.publisher.localCampo Mouraopt_BR
dc.contributor.advisor1Foleis, Juliano Henrique-
dc.contributor.referee1Foleis, Juliano Henrique-
dc.contributor.referee2Campiolo, Rodrigo-
dc.contributor.referee3Hübner, Rodrigo-
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentDepartamento Acadêmico de Computaçãopt_BR
dc.publisher.programCiência da Computaçãopt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
Aparece nas coleções:CM - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
classificacaopassaroscantoschamados.pdf824,38 kBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons