Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/5439
Título: Scaffolding algorithm using multiple referencegenomes: a case study of the rhizobium ecuadorensecnpso 671t
Autor(es): Mercado, Hugo Mauricio Pena
Orientador(es): Kashiwabara, Andre Yoshiaki
Palavras-chave: Genoma
Nitrogênio - Fixação
Plasmídeos
Genomes
Nitrogen - Fixation
Plasmids
Data do documento: 12-Dez-2019
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Cornelio Procopio
Citação: MERCADO, Hugo Mauricio Pena. Scaffolding algorithm using multiple reference genomes: a case study of the rhizobium ecuadorense cnpso 671t. 2019. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2019.
Resumo: As consequências de longo prazo da utilização dos fertilizantes artificiais começaram a serem percebidas. Além disso, as relações entre plantas e microorganismos no solo (tal como fungos -Mycorrhiza- e bactéria -Rhizobacteria-) vem se tornando tema de vários estudos que estão preocupados na alimentação de 9.8 bilhões de pessoas no mundo. Uma abordagem para estudar mais profundamente esses microorganismos é através do sequenciamento do DNA. Contudo, as tecnologias de sequenciamento geram sequências curtas, fornecendo um problema computacionalmente desafiante devido a presença de repetições e cobertura não-uniforme. Neste trabalho, é apresentado um algoritmo para o problema de scaffolding utilizando múltiplos genomas de referência, que tenta evitar os erros de montagens (missassemblies) e fornecer tanto cromossomos putativos, quanto plasmídeos putativos. Embora existam alguns algoritmos para o problema de scaffolding, não foi encontrado nenhum que recebe montagens de genomas em seu estado de contigs como referência, mesmo que essas montagens contenham informações úteis. Além disso, esses algoritmos apenas montam um único scaffold e negligenciam a possibilidade de introduzir misassemblies causados pela utilização de grafos e heurísticas. O algoritmo proposto oferece como alternativa uma analise mais avançada dos genomas, e a possibilidade de customizar a saída de acordo com necessidades específicas. É proposto que o algoritmo ajude na identificação de plasmídeos simbióticos com genomas, encontrando possíveis homólogos nos genomas de referencias. Finalmente, uma futura generalização do algoritmo de scaffolding poderá ser utilizado não apenas para procariotos, mas também para grandes genomas eucarióticos.
Abstract: Recently, we started to realize the long-term consequences of artificial fertilizers. Besides, understanding the relationships between plants and micro-organisms in the soil (such as fungus -Mycorrhiza- and bacteria -Rhizobacteria-) has become the center of numerous studies looking forward to feeding a 9.8 billion people world1. An approach to further study those organisms is the sequencing of its DNA. However, when these sequencing technologies only allow us to generate short-reads, this becomes a challenging computational problem(due to the presence of repeated sequences and non-uniform coverage). Here we present a scaffolding algorithm using multiple-reference genomes, that can discriminate between misassemblies and generate putative plasmids and chromosomes. Although there are many scaffolding algorithms already2, we found none of them take as input genomes in the contig stage, even though these genomes might also contain useful information. Furthermore, these scaffolders only take care of the assembly of scaffolds and neglect the possible introduction of misassemblies due to the use of graphs and heuristics. Our algorithm offers an alternative for more advanced analysis of genomes, and the possibility to personalize the outputted scaffolds according to specific needs. We hope our algorithm could help identify symbiotic plasmids within genomes, by finding homologous in reference genomes. Besides, the generalization of scaffolding can be brought not only to prokaryotes but also to larger genomes such as eukaryotes.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/5439
Aparece nas coleções:CP - Programa de Pós-Graduação em Bioinformática

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
CP_PGBIOINFO_M_Mercado,_Hugo_Mauricio_Pena_2020.pdf13,06 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.