Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/37666
Título: Ferramenta de extração de características de sequências biológicas
Autor(es): Gregorio, Vitor
Orientador(es): Paschoal, Alexandre Rossi
Palavras-chave: Bioinformática
Python (Linguagem de programação de computador)
Aquisição de dados
Bioinformatics
Python (Computer program language)
Data Acquisition
Data do documento: 11-Mai-2021
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Cornelio Procopio
Citação: GREGORIO, Vitor. Ferramenta de extração de características de sequências biológicas. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2021.
Resumo: A bioinformática é uma área da ciência que busca analisar, interpretar e solucionar problemas biológicos. Na computação, a análise exploratória de dados permite visualizar e ter uma maior compreensão sobre os dados. Por exemplo, representações gráficas ou tabelares são formas amigáveis de ter essa visão. Nesse sentido, este TCC apresenta o resultado final da construção de uma ferramenta Desktop para análise exploratória de sequências biológicas, apelando para a visualização destes dados. A ferramenta foi desenvolvida em Python, que permite gerar relatórios para visualização dos resultados. Foram implementadas nove características, sendo: tamanho da sequência, conteúdo GC e taxa (ratio) GC, contagem k-mer (e.g., dinucleotídeos e trinucleotideos), Dinucleotide-based Auto Covarience, Dinucleotide-based Cross Covarience, Trinucleotide-based Auto Covarience e Trinucleotide-based Cross Covarience. Assim, bibliotecas como Biopython, Numpy, Tkinter e Matplotlib, foram usadas na construção da análise das sequências biológicas e criação de gráficos, através de uma interface intuitiva e usual. Por fim, esta é uma ferramenta amigável em que o usuário pode inserir a sequência e exportar seus relatórios e gráficos em vários formatos para ser usado em seus trabalhos científicos.
Abstract: Bioinformatics is an area of science that seeks to analyze, interpret and solve biological pro- blems. In the analysis, an exploratory data analysis allows you to visualize and have a greater understanding of the data. For example, graphical or tabular representations are friendly ways of having this vision. In this sense, this TCC presents the final result of the construction of a Desktop tool for exploratory analysis of biological sequences, appealing for visualization of this data. The tool was developed in Python, which allows generating reports to view the results. Nine characteristics were implemented, namely: sequence size, GC content and GC ratio, k-mer count (ex: dinucleotides and trinucleotides), Dinucleotide-based Auto Covarience, Dinucleotide- based Cross Covarience, Trinucleotide-based Auto Covarience and Trinucleotide-based Cross Covarience. Thus, libraries such as Biopython, Numpy, Tkinter and Matplotlib, were used in the construction of the analysis of biological sequences and creation of graphics, through an intuitive and usual interface. Finally, it is a user-friendly tool in which the user can insert the sequence and export his reports and graphs in various formats to be used in his scientific works.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/37666
Aparece nas coleções:CP - Engenharia da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
ferramentaextracaocaracteristicassequencias.pdf1,78 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons