Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/39877Registro completo de metadados
| Campo DC | Valor | Idioma |
|---|---|---|
| dc.creator | Fuganti, Lucas Costa | - |
| dc.date.accessioned | 2026-03-26T14:49:08Z | - |
| dc.date.available | 2026-03-26T14:49:08Z | - |
| dc.date.issued | 2025-06-27 | - |
| dc.identifier.citation | FUGANTI, Lucas Costa. BITSER: uma ferramenta para classificação de genomas virais. 2025. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025. | pt_BR |
| dc.identifier.uri | http://repositorio.utfpr.edu.br/jspui/handle/1/39877 | - |
| dc.description.abstract | The exponential increase of available biological data, augmented by high-throughput sequen- cing technologies, has led to a particular case of big data research known as bioinformatics. Therefore, there is a need to develop methods for analyzing biological data that are efficient, interpretable and data-driven for knowledge discovery. This paper proposes the BITSER method as a new alignment-free approach for feature extraction and classification of biological sequen- ces. BITSER makes use of adaptations of texture analysis techniques from the field of computer vision, such as Local Binary Pattern (LBP) and derived aspects to extract sequence histograms, based on the electron-ion interaction potential (EIIP) values of nucleotides. The method adopts files in the FASTA format as input data, with no need for alignment or prior annotation, and offers a direct representation of characteristics with biological significance. The validation of BITSER was performed considering the SARS-CoV-2 and DENV viral genomes, achieving classification accuracy values of over 99% in various classification algorithms. The feature importance analy- sis enabled a significant dimensional reduction of features, preserving the discriminatory power of the method with only a few features per data set. Compared to existing methods, BITSER indicated superior results, computational efficiency, and interpretability. These results reinforce the method's robustness, scalability and potential for large-scale application in genomic analysis. | pt_BR |
| dc.description.sponsorship | Conselho Nacional do Desenvolvimento Científico e Tecnológico (CNPq) | pt_BR |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | pt_BR |
| dc.description.sponsorship | Fundação Araucária de Apoio ao Desenvolvimento Científico e Tecnológico do Paraná | pt_BR |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Tecnológica Federal do Paraná | pt_BR |
| dc.rights | openAccess | pt_BR |
| dc.rights | Attribution-NonCommercial-ShareAlike 4.0 International | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/4.0/ | * |
| dc.subject | Genômica | pt_BR |
| dc.subject | Classificação | pt_BR |
| dc.subject | Bioinformática | pt_BR |
| dc.subject | Genomics | pt_BR |
| dc.subject | Classification | pt_BR |
| dc.subject | Bioinformatics | pt_BR |
| dc.title | BITSER: uma ferramenta para classificação de genomas virais | pt_BR |
| dc.title.alternative | BITSER: a tool for classifying viral genomes | pt_BR |
| dc.type | bachelorThesis | pt_BR |
| dc.description.resumo | O aumento exponencial nos dados biológicos disponíveis, incrementado por tecnologias de sequenciamento de alto rendimento, leva a um caso particular de pesquisa "big data" conhecido como bioinformática. Logo, com a necessidade no desenvolvimento de métodos de análise de dados biológicos que sejam eficientes, interpretáveis e guiados pelos dados para descoberta de conhecimento. Este trabalho propõe o método BITSER, como uma nova abordagem livre de alinhamento para a extração de características e classificação de sequências biológicas. BITSER faz uso de adaptações de técnicas de análise de textura da área de visão computacional, como Local Binary Pattern (LBP) e aspectos derivados para extrair histogramas de sequências, baseando-se nos valores de potencial de interação elétron-íon (EIIP) de nucleotídeos. O método adota como entrada de dados arquivos no formato FASTA, não sendo necessário alinhamento ou anotação prévia, e oferece uma representação de características direta e com significado biológico. A validação de BITSER foi feita com os genomas virais SARS-CoV-2 e DENV, obtendo valores de acurácia de classificação superiores a 99% em diversos algoritmos de classificação. A análise de importância de características possibilitou uma redução dimensional de características significativas, preservando o poder discriminatório do método com apenas algumas características por conjunto de dados. Em comparação com métodos existentes, BITSER indicou resultados superiores, eficiência computacional e interpretabilidade. Esses resultados reforçam a robustez, escalabilidade e potencial para aplicação em larga escala de análise genômica do método. | pt_BR |
| dc.degree.local | Cornélio Procópio | pt_BR |
| dc.publisher.local | Cornelio Procopio | pt_BR |
| dc.contributor.advisor1 | Lopes, Fabricio Martins | - |
| dc.contributor.advisor-co1 | Zanon, Matheus Henrique Pimenta | - |
| dc.contributor.referee1 | Lopes, Fabricio Martins | - |
| dc.contributor.referee2 | Kashiwabara, André Yoshiaki | - |
| dc.contributor.referee3 | Bonidia, Robson Parmezan | - |
| dc.publisher.country | Brasil | pt_BR |
| dc.publisher.program | Engenharia de Software | pt_BR |
| dc.publisher.initials | UTFPR | pt_BR |
| dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE | pt_BR |
| Aparece nas coleções: | CP - Engenharia de Software | |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| ferramentaclassificacaogenomasvirais.pdf | 2,62 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons

