Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/39877
Registro completo de metadados
Campo DCValorIdioma
dc.creatorFuganti, Lucas Costa-
dc.date.accessioned2026-03-26T14:49:08Z-
dc.date.available2026-03-26T14:49:08Z-
dc.date.issued2025-06-27-
dc.identifier.citationFUGANTI, Lucas Costa. BITSER: uma ferramenta para classificação de genomas virais. 2025. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/39877-
dc.description.abstractThe exponential increase of available biological data, augmented by high-throughput sequen- cing technologies, has led to a particular case of big data research known as bioinformatics. Therefore, there is a need to develop methods for analyzing biological data that are efficient, interpretable and data-driven for knowledge discovery. This paper proposes the BITSER method as a new alignment-free approach for feature extraction and classification of biological sequen- ces. BITSER makes use of adaptations of texture analysis techniques from the field of computer vision, such as Local Binary Pattern (LBP) and derived aspects to extract sequence histograms, based on the electron-ion interaction potential (EIIP) values of nucleotides. The method adopts files in the FASTA format as input data, with no need for alignment or prior annotation, and offers a direct representation of characteristics with biological significance. The validation of BITSER was performed considering the SARS-CoV-2 and DENV viral genomes, achieving classification accuracy values of over 99% in various classification algorithms. The feature importance analy- sis enabled a significant dimensional reduction of features, preserving the discriminatory power of the method with only a few features per data set. Compared to existing methods, BITSER indicated superior results, computational efficiency, and interpretability. These results reinforce the method's robustness, scalability and potential for large-scale application in genomic analysis.pt_BR
dc.description.sponsorshipConselho Nacional do Desenvolvimento Científico e Tecnológico (CNPq)pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)pt_BR
dc.description.sponsorshipFundação Araucária de Apoio ao Desenvolvimento Científico e Tecnológico do Paranápt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-ShareAlike 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/*
dc.subjectGenômicapt_BR
dc.subjectClassificaçãopt_BR
dc.subjectBioinformáticapt_BR
dc.subjectGenomicspt_BR
dc.subjectClassificationpt_BR
dc.subjectBioinformaticspt_BR
dc.titleBITSER: uma ferramenta para classificação de genomas viraispt_BR
dc.title.alternativeBITSER: a tool for classifying viral genomespt_BR
dc.typebachelorThesispt_BR
dc.description.resumoO aumento exponencial nos dados biológicos disponíveis, incrementado por tecnologias de sequenciamento de alto rendimento, leva a um caso particular de pesquisa "big data" conhecido como bioinformática. Logo, com a necessidade no desenvolvimento de métodos de análise de dados biológicos que sejam eficientes, interpretáveis e guiados pelos dados para descoberta de conhecimento. Este trabalho propõe o método BITSER, como uma nova abordagem livre de alinhamento para a extração de características e classificação de sequências biológicas. BITSER faz uso de adaptações de técnicas de análise de textura da área de visão computacional, como Local Binary Pattern (LBP) e aspectos derivados para extrair histogramas de sequências, baseando-se nos valores de potencial de interação elétron-íon (EIIP) de nucleotídeos. O método adota como entrada de dados arquivos no formato FASTA, não sendo necessário alinhamento ou anotação prévia, e oferece uma representação de características direta e com significado biológico. A validação de BITSER foi feita com os genomas virais SARS-CoV-2 e DENV, obtendo valores de acurácia de classificação superiores a 99% em diversos algoritmos de classificação. A análise de importância de características possibilitou uma redução dimensional de características significativas, preservando o poder discriminatório do método com apenas algumas características por conjunto de dados. Em comparação com métodos existentes, BITSER indicou resultados superiores, eficiência computacional e interpretabilidade. Esses resultados reforçam a robustez, escalabilidade e potencial para aplicação em larga escala de análise genômica do método.pt_BR
dc.degree.localCornélio Procópiopt_BR
dc.publisher.localCornelio Procopiopt_BR
dc.contributor.advisor1Lopes, Fabricio Martins-
dc.contributor.advisor-co1Zanon, Matheus Henrique Pimenta-
dc.contributor.referee1Lopes, Fabricio Martins-
dc.contributor.referee2Kashiwabara, André Yoshiaki-
dc.contributor.referee3Bonidia, Robson Parmezan-
dc.publisher.countryBrasilpt_BR
dc.publisher.programEngenharia de Softwarept_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWAREpt_BR
Aparece nas coleções:CP - Engenharia de Software

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
ferramentaclassificacaogenomasvirais.pdf2,62 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons