Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/30171
Registro completo de metadados
Campo DCValorIdioma
dc.creatorIto, Eric Augusto-
dc.date.accessioned2022-11-24T14:37:49Z-
dc.date.available2022-11-24T14:37:49Z-
dc.date.issued2020-10-21-
dc.identifier.citationITO, Eric Augusto. Plawss: power law semantic similarity metodologia data-driven baseada em lei de potência para o cálculo de similaridade semântica go. 2020. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/30171-
dc.description.abstractGenes are widely studied by the scientific community due to their importance in various researches, many of them related to health. Because of this, many methods were developed to calculate the SS between genes. Semantic Similarity has been used in several researches such as network inference and validation, protein folding, among others. Initially proposed by Wang el al. (WANG et al., 2007) and which was added to the GOGO tool (ZHAO; WANG, 2018), the methodology presented by Wang and GOGO is not limited to using IC to calculate the semantic similarity. Wang proposed a hybrid method that calculates similarity from the topology of the directed acyclic graph GO. GOGO in turn proposed to use the number of child terms as a substitute for IC, since GOGO noticed the inverse correlation between IC and the number of child terms, so even without using the IC, GOGO manages to take advantage of methods based on IC along with Wang’s hybrid method. However, GOGO proposes a method that depends on variables that do not fit the data of ontologies, on the other hand Wang is limited to weighing the terms GO only depending on the type of connection between the terms GO. This work presents a new method named PLAWSS for calculating semantic similarity in genes using a hybrid model to calculate semantic similarity using Genetic Ontology, which is data-driven adapting to ontology data using power law to weigh each GO term, and that in addition to the type of connection, this work also takes into account the number of children of the ancestor to identify the specificity of the GO term. Six data sets composed of metabolic pathways were clustered using the semantic similarities calculated between each pair of genes, the clusters formed from the molecular functions and biological processes showed the best results, being 83.33% and 66.67% respectively, corroborating for the testing of the proposed method.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.subjectComputação semânticapt_BR
dc.subjectBioinformáticapt_BR
dc.subjectOntologiapt_BR
dc.subjectSemantic computingpt_BR
dc.subjectBioinformaticspt_BR
dc.subjectOntologypt_BR
dc.titlePlawss: power law semantic similarity metodologia data-driven baseada em lei de potência para o cálculo de similaridade semântica GOpt_BR
dc.title.alternativePower law data-driven methodology for calculating semantic similarity GOpt_BR
dc.typemasterThesispt_BR
dc.description.resumoGenes são amplamente estudados pela comunidade científica devido a sua importância em diversas pesquisas, muitas delas relacionadas a saúde. Por conta disto, muitos métodos foram desenvolvidos para calcular a Similaridade Semântica (SS) entre genes. A Similaridade Semântica tem sido usado em várias pesquisas como inferência e validação de redes, dobramento de proteínas, entre outras. Inicialmente proposto por Wang el al. (WANG et al., 2007) e que foi incrementado na ferramenta GOGO (ZHAO; WANG, 2018), a metodologia apresentada por Wang e GOGO não se limita a usar Information content (IC) para calcular a similaridade semântica. Wang propôs um método híbrido que calcula a similaridade a partir da topologia do grafo acíclico direcionado GO. GOGO por sua vez propôs usar o número de termos filhos como substituto de IC, visto que o GOGO notou a correlação inversa entre IC e o número de termos filho, dessa forma mesmo sem usar o IC, GOGO consegue ter as vantagens de métodos baseados em IC junto com o método híbrido de Wang. Porém o GOGO propõe um método que depende de variáveis que não se ajustam aos dados de ontologias, por outro o Wang se limita a pesar os termos GO somente dependendo do tipo de ligação entre os termos GO. Este trabalho apresenta um novo método chamado de Power LAW Semantic Similarity (PLAWSS) para o cálculo da similaridade semântica em genes utilizando um modelo híbrido para calcular a similaridade semântica utilizando a Ontologia Gênica, o qual é data-driven se adaptando aos dados de ontologia utilizando lei de potência para pesar cada termo GO, e que em adição ao tipo de ligação, neste trabalho também é levado em consideração o número de filhos do ancestral para identificar a especificidade do termo GO. Seis conjuntos de dados compostos por vias metabólicas foram clusterizados utilizando as similaridades semânticas calculadas entre cada par de gene, os clusters formados a partir das funções moleculares e processos biológicos apresentaram os melhores resultados, sendo eles, 83,33% e 66,67% respectivamente, corroborando para a provação do método proposto.pt_BR
dc.degree.localCornélio Procópiopt_BR
dc.publisher.localCornelio Procopiopt_BR
dc.creator.ID0000-0002-0030-6881pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/5833263148868450pt_BR
dc.contributor.advisor1Lopes, Fabrício Martins-
dc.contributor.advisor1IDhttp://orcid.org/0000-0002-8786-3313pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1660070580824436pt_BR
dc.contributor.referee1Kashiwabara, Andre Yoshiaki-
dc.contributor.referee1IDhttps://orcid.org/0000-0003-3280-2035pt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/3194328548975437pt_BR
dc.contributor.referee2Vicente, Fabio Fernandes da Rocha-
dc.contributor.referee2IDhttps://orcid.org/0000-0001-7716-3260pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/5799700325728628pt_BR
dc.contributor.referee3Lopes, Fabrício Martins-
dc.contributor.referee3IDhttp://orcid.org/0000-0002-8786-3313pt_BR
dc.contributor.referee3Latteshttp://lattes.cnpq.br/1660070580824436pt_BR
dc.contributor.referee4Castro, Mauro Antônio Alves-
dc.contributor.referee4IDhttps://orcid.org/0000-0003-4942-8131pt_BR
dc.contributor.referee4Latteshttp://lattes.cnpq.br/6484877487662355pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-Graduação em Bioinformáticapt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRApt_BR
dc.subject.capesEngenharia/Tecnologia/Gestãopt_BR
Aparece nas coleções:CP - Programa de Pós-Graduação em Bioinformática

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
semanticametodologiadatadriven.pdf2,89 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.