Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/35535
Título: Classificação de risco de extinção de vertebrados utilizando relatórios de texto
Título(s) alternativo(s): Development of vertebrate extinction risk multi-label classification model using natural language processing
Autor(es): Fiel, Ewerton Godoi
Orientador(es): Gomes Júnior, Luiz Celso
Palavras-chave: Classificação - Modelos
Processamento de linguagem natural (Computação)
Vertebrados
Animais em extinção
Classification - Models
Natural language processing (Computer science)
Vertebrates
Endangered species
Data do documento: 7-Jun-2023
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: FIEL, Ewerton Godoi. Classificação de risco de extinção de vertebrados utilizando relatórios de texto. 2023. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023.
Resumo: Vivemos em uma sociedade em constante crescimento, com aumento da população, evolução tecnológica e rápida adaptação das pessoas. No entanto, esse crescimento traz consigo mudanças que podem gerar impactos em várias áreas do planeta. Neste projeto, abordamos os impactos do carnivorismo humano nos vertebrados, analisando como as mudanças feitas pelo homem para suprir suas necessidades alimentares, tanto de fontes animais quanto vegetais, têm afetado os vertebrados. O objetivo do projeto foi desenvolver um modelo capaz de aprender a classificar espécies de acordo com o tipo de risco de extinção que elas enfrentam, com base em um conjunto de dados categorizados manualmente. O foco dos resultados está em maximizar o número de espécies em real risco encontradas, ou seja, buscamos minimizar o número de falsos negativos classificados. Ao longo do projeto foram construidos três principais modelos de classificação. No primeiro modelo, utilizou-se um conjunto de dados com múltiplos rótulos, contendo 9 rótulos no total. As características foram extraídas das 25 colunas de valores binários do conjunto de dados representando as ameaças presentes. No segundo modelo, manteve-se os mesmos rótulos, mas as características foram substituídas. Foi realizado o processamento dos dados de texto para construir novas características, que foram utilizadas no treinamento deste segundo modelo. No terceiro e último modelo desenvolvido, as características utilizadas nos dois primeiros modelos foram combinadas para o treinamento. Isso resultou em melhores resultados em comparação aos modelos anteriores, tanto nos valores agregados de todos os rótulos, quanto na maioria dos rótulos individuais, especialmente aqueles que inicialmente apresentaram resultados insatisfatórios. Os resultados obtidos com o modelo final foram satisfatórios, atingindo um valor de f1 score médio de 0,82 e 0,77 de acurácia na identificação de espécies ameaçadas, indicando um progresso significativo no alcance dos objetivos do projeto. Em geral, os resultados foram considerados satisfatórios.
Abstract: In a society characterized by continuous growth, increasing population, technological advancements, and rapid adaptation, the changes accompanying this growth can have profound impacts on various areas of the planet. This project focuses on exploring the impacts of human carnivorism on vertebrates and analyzing how the changes made by humans to meet their dietary needs, from both animal and plant sources, have affected vertebrates. The project’s objective was to develop a model capable of learning to classify species based on the type of extinction risk they face, using a manually categorized dataset. The primary focus of the results was to maximize the accurate identification of truly threatened species, thereby minimizing the number of false negatives. Throughout the project, three main classification models were constructed. The first model utilized a dataset with multiple labels, consisting of a total of 9 labels. Features were extracted from the dataset’s 25 columns of binary values representing the present threats. In the second model, while retaining the same labels, the features were replaced. Text data processing techniques were employed to generate new features, which were then used for training the second model. In the third and final model, the features from the first two models were combined for training, resulting in improved performance compared to the earlier models. This improvement was evident in both the aggregated values of all labels and the majority of individual labels, particularly those that initially exhibited unsatisfactory results. The final model yielded satisfactory results, with an average f1 score of 0.82 and an accuracy of 0.77 in identifying threatened species, indicating significant progress towards achieving the project’s objectives. Overall, the obtained results were considered satisfactory.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/35535
Aparece nas coleções:CT - Engenharia de Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
vertebrados.pdf1,06 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons