Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/37936
Registro completo de metadados
Campo DCValorIdioma
dc.creatorBarbosa, Denilson Fagundes-
dc.date.accessioned2025-08-19T23:34:32Z-
dc.date.available2025-08-19T23:34:32Z-
dc.date.issued2025-04-29-
dc.identifier.citationBARBOSA, Denilson Fagundes. Predição de regiões codificadoras de proteínas em rna circulares e transcriptoma em montagem de novo. 2025. Tese (Doutorado em Programa de Pós-Graduação Associado em Bioinformática (Ufpr/Utfpr)) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/37936-
dc.description.abstractThe prediction of protein-coding regions (CDSs) in circular RNAs (circRNAs) and de novo assembled transcriptomes represents significant open challenges in bioinformatics due to the non-canonical nature of translation in circRNAs and the heterogeneity of transcripts generated in assemblies. This thesis proposes computational methods that integrate complementary approaches of kernel methods and probabilistic models to overcome these limitations. We developed four main contributions: (i) circTIS, a tool based on a Support Vector Machine (SVM) with the weighted degree kernel (WDK) for predicting translation initiation sites (TIS) in circRNAs, achieving a precision of 93.12% and sensitivity of 86.03%, outperforming established tools; (ii) cirCodAn, an annotator employing generalized hidden Markov models (GHMMs) adapted to molecular cyclicity, achieving F1-scores of up to 77.06% in identifying CDSs in H. sapiens circRNAs; (iii) strkernels, a high-performance Python package with efficient implementations of string kernels, validated in tasks such as antimicrobial peptide classification (AUC-ROC of 0.99); and (iv) CodAnSVM, a hybrid method combining GHMMs and SVMs for annotating de novo assembled transcriptomes, demonstrating a 5 percentual points F1-score improvement over traditional methods for complete transcripts and satisfactory results for partial transcripts. The results show that integrating generative (GHMMs) and discriminative (SVMs) models enables precise analyses in challenging biological scenarios, such as predicting non-canonical initiation codons and annotating partial transcripts. The developed tools, available as open-source software, address methodological gaps in the study of coding circRNAs and the functional analysis of transcriptomes.pt_BR
dc.description.sponsorshipConselho Nacional do Desenvolvimento Científico e Tecnológico (CNPq)pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.subjectBioinformáticapt_BR
dc.subjectProteínaspt_BR
dc.subjectBiologia molecularpt_BR
dc.subjectBioinformaticspt_BR
dc.subjectProteinspt_BR
dc.subjectMolecular biologypt_BR
dc.titlePredição de regiões codificadoras de proteínas em rna circulares e transcriptoma em montagem de novopt_BR
dc.title.alternativePrediction of protein-coding regions in circular rna and de novo assembled transcriptomespt_BR
dc.typedoctoralThesispt_BR
dc.description.resumoA predição de regiões codificadoras de proteína (CDSs) em RNAs circulares (circRNAs) e transcriptomas montados de novo representam problemas relevantes em aberto na bioinformática, devido à natureza não canônica da tradução em circRNAs e à heterogeneidade de transcritos gerados em montagens. Esta tese propõe métodos computacionais que integram abordagens complementares de métodos de kernel e modelos probabilísticos para superar essas limitações. Desenvolvemos quatro contribuições principais: (i) circTIS, uma ferramenta baseada em uma máquina de vetores de suporte (SVM) com o string kernel de grau ponderado (WDK) para predição de sítios de iniciação de tradução (TIS) em circRNAs, que alcançou precisão de 93,12% e sensibilidade de 86,03%, superando ferramentas consolidadas; (ii)cirCodAn, um anotador que emprega modelos de Markov ocultos generalizados (GHMMs) adaptados à ciclicidade molecular, obtendo F1-scores de até 77,06% na identificação de CDSs em circRNAs de H. sapiens; (iii) strkernels, um pacote Python de alta performance com implementações eficientes de string kernels, validado em tarefas como classificação de peptídeos antimicrobianos (AUC-ROC de 0,99); e (iv) CodAnSVM, um método híbrido que combina GHMMs e SVMs para anotação de transcriptomas de montagens de novo, com ganho de 5 pontos percentuais em F1-score sobre métodos tradicionais em transcritos completos e resultados satisfatórios para transcritos parciais. Os resultados mostram que a integração de modelos generativos (GHMMs) e discriminativos (SVMs) possibilita análises precisas em cenários biológicos desafiadores, como a predição de códons de iniciação não canônicos e a anotação de transcritos parciais. As ferramentas desenvolvidas, disponíveis como software aberto, preenchem lacunas metodológicas no estudo de circRNAs codificantes e na análise funcional de transcriptomas.pt_BR
dc.degree.localCornélio Procópiopt_BR
dc.publisher.localCornelio Procopiopt_BR
dc.creator.IDhttps://orcid.org/0000-0002-6104-1987pt_BR
dc.creator.Latteshttps://lattes.cnpq.br/3857603454079212pt_BR
dc.contributor.advisor1Kashiwabara, Andre Yoshiaki-
dc.contributor.advisor1IDhttps://orcid.org/0000-0003-3280-2035pt_BR
dc.contributor.advisor1Latteshttps://lattes.cnpq.br/3194328548975437pt_BR
dc.contributor.referee1Durham, Alan Mitchell-
dc.contributor.referee1Latteshttps://lattes.cnpq.br/1927611801056285pt_BR
dc.contributor.referee2Paschoal, Alexandre Rossi-
dc.contributor.referee2Latteshttps://lattes.cnpq.br/5834088144837137pt_BR
dc.contributor.referee3Kashiwabara, Andre Yoshiaki-
dc.contributor.referee3Latteshttps://lattes.cnpq.br/3194328548975437pt_BR
dc.contributor.referee4Lopes, Fabricio Martins-
dc.contributor.referee4Latteshttps://lattes.cnpq.br/1660070580824436pt_BR
dc.contributor.referee5Boas, Laurival Antonio Vilas-
dc.contributor.referee5Latteshttps://lattes.cnpq.br/6053806923630324pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-Graduação Associado em Bioinformática (Ufpr/Utfpr)pt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::CIENCIAS SOCIAIS APLICADASpt_BR
dc.subject.capesCiência da Computaçãopt_BR
Aparece nas coleções:CP - Programa de Pós-Graduação em Bioinformática

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
predicaoregioescodificadorasrna.pdf1,55 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.