Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/5420
Registro completo de metadados
Campo DCValorIdioma
dc.creatorCantelli, Geraldo Cesar-
dc.date.accessioned2020-11-03T17:12:41Z-
dc.date.available2020-11-03T17:12:41Z-
dc.date.issued2020-09-04-
dc.identifier.citationCANTELLI, Geraldo Cesar. Solução de integração e avaliação de softwares de anotação genômica em coffea spp. 2020. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/5420-
dc.description.abstractOne of the biggest challenges of bioinformatics is the analysis of complete genomes, for instance the identification of computationally predicted genes and its association to respective biological functions. Therefore, it is important to design experiments that can test these predictions and compare them with existing ones so that you can measure their performance. With a growing volume of genomic and transcriptomic available data, efficient and affordable pipelines to perform a good gene annotation process are needed. How to improve the correct genome annotation avoiding over or under prediction to obtain more accurary? In this work we study which characteristic is more interesting to a genomic annotation software comparing two software, PASA and MAKER, analyzing the genome of Coffea canephora, C. eugenioides and C. arabica. We also executed a quality improvement in these Coffea genome annotation and peformed statistical comparison between these two software. Besides it is proposed an automated tool which allows to repeat some of the analyses performed in this work. Results show the effectiveness of using detection of all alternative splicing possibilities in the algorithm of annotation due to PASA finding more exclusive genes (compared with MAKER) and located genes equally in different regions of the chromosomes, which is difficult for many gene predictors. New versions of the annotation of the genomes of C. arabica, C. canephora and C. eugenioides were generated to be made available for use by the scientific community. The Ensemble Solution program was developed to make possible evaluation of genomic annotation software, GFF3 files, lists of genes exclusively and Venn diagrams, to import GenBank properties and generate more complete reports.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.subjectGenomapt_BR
dc.subjectCafépt_BR
dc.subjectSoftware - Desenvolvimentopt_BR
dc.subjectGenomespt_BR
dc.subjectCoffeept_BR
dc.subjectComputer software - Developmentpt_BR
dc.titleSolução de integração e avaliação de softwares de anotação genômica em coffea spppt_BR
dc.typemasterThesispt_BR
dc.description.resumoUm dos maiores desafios da bioinformática é a análise de genomas completos, por exemplo, a identificação de genes preditos computacionalmente e a sua associação com as respectivas funções biológicas. Portanto é importante o design de experimentos que possam testar essas previsões e compara-las com outras já existentes para que se possa mensurar seu desempenho. Realizar o experimento apenas com um software não seria interessante pela necessidade de comparar algoritmos e sua eficiência. Devido ao volume crescente de dados genômicos e transcriptômicos disponíveis, são necessárias pipelines eficientes e acessíveis para gerar predições gênicas e inferir com um maior grau de confiabilidade as suas respectivas funções biológicas. Como melhorar a qualidade da anotação genômica, evitando “over” ou “under prediction” e obtendo mais precisão? Neste trabalho, estudamos qual característica e mais interessante para um software de anotação genômica comparando dois programas, PASA e MAKER, analisando o genoma de Coffea canephora, C. eugenioides e C. arábica. Através da realização dessas pipelines, notou-se através de programas como BUSCO e Quast um aprimoramento no genoma das amostras de café e realizada uma comparação estatística entre esses dois programas. Além disso e proposta uma nova ferramenta automatizada que permite repetir algumas das analises realizadas neste trabalho. Os resultados mostram a eficácia do uso da detecção de todas as possibilidades de splices alternativos no algoritmo de anotação, devido o PASA encontrar mais genes exclusivos e genes localizados igualmente em diferentes regiões dos cromossomos, o que é difícil para muitos preditores de genes. Foram geradas novas versões da anotações dos genomas de C. arábica, C. canephora e C. eugenioides para que possam ser disponibilizadas para utilização pela comunidade científica. Foi desenvolvido um programa Ensemble Solution para viabilizar a automatização da avaliação de software de anotação genômica, o qual trabalhando com arquivos de GFF3, produz listas de genes encontrados exclusivamente por cada software avaliado e gera diagramas de Venn, permitindo importar dados do GenBank (como a tradução das proteínas) e gerar relatórios mais completos.pt_BR
dc.degree.localCornélio Procópiopt_BR
dc.publisher.localCornelio Procopiopt_BR
dc.creator.IDhttps://orcid.org/0000-0003-4445-5915pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/0185555919477080pt_BR
dc.contributor.advisor1Pereira, Luiz Filipe Protasio-
dc.contributor.advisor1IDhttps://orcid.org/0000-0002-4872-6607pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1177022282500069pt_BR
dc.contributor.advisor-co1Lopes, Fabricio Martins-
dc.contributor.advisor-co1IDhttp://orcid.org/0000-0002-8786-3313pt_BR
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/1660070580824436pt_BR
dc.contributor.referee1Kashiwabara, Andre Yoshiaki-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/3194328548975437pt_BR
dc.contributor.referee2Pereira, Luiz Filipe Protasio-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/1177022282500069pt_BR
dc.contributor.referee3Suzuki, Suzana Tiemi Ivamoto-
dc.contributor.referee3Latteshttp://lattes.cnpq.br/1763200047578046pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-Graduação em Bioinformáticapt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA BIOMEDICA::BIOENGENHARIApt_BR
dc.subject.capesEngenharia/Tecnologia/Gestãopt_BR
Aparece nas coleções:CP - Programa de Pós-Graduação em Bioinformática

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
CP_PPGBIOINFO_M_Cantelli_Geraldo_2020.pdf3,09 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.