Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/3334
Registro completo de metadados
Campo DCValorIdioma
dc.creatorAlmeida, Thissiany Beatriz-
dc.date.accessioned2018-08-15T16:28:11Z-
dc.date.available2018-08-15T16:28:11Z-
dc.date.issued2018-06-28-
dc.identifier.citationALMEIDA, Thissiany Beatriz. Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulo. 2018. 97 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2018.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/3334-
dc.description.abstractThe technological advance brings as a consequence a great challenge, which is to find a way to store and extract useful knowledge of a mass of data. An alternative to this scenario is the use of Data Mining tools, being one of the techniques used, the Attribute Selection. The selection of attributes is one of the techniques that can be used to reduce the dimensionality of a database, with the main objective to identify the relevant attributes, thus increasing the predictive power of the classifier. Basically, there are three approaches to Attribute Selection: Embedded, Filter, and Wrapper. In the context of multi-label hierarchical classification, where classes to be predicted are structured according to a hierarchy, few works in the literature present proposals for attribute selection techniques. Thus, in this work, we propose a new method of attribute selection based on the Wrapper approach for global multi-label hierarchical classification. The FSW-HMC method is divided into two main steps: the search strategy (Artificial Immune System and Genetic Algorithm) and subset evaluation (Clus-HMC multi-label hierarchical classifier and AUPRC performance measure). In order to perform the experiments, biological data from 10 Genetic Ontology databases are used, and the classes are structured in a hierarchy in the form of a Directed Acyclic Graph (DAG). When performing the analysis of the generated subsets it can be noted that there was a significant reduction in the number of attributes greater than 63 %. After analyzing the subsets, it can be seen that the difference of the AUPRC measure obtained in the subsets for the base with all the attributes is less than 0.025.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.subjectMineração de dados (Computação)pt_BR
dc.subjectBanco de dadospt_BR
dc.subjectAlgorítmos genéticospt_BR
dc.subjectData miningpt_BR
dc.subjectData basespt_BR
dc.subjectGenetic algorithmspt_BR
dc.titleSeleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulopt_BR
dc.title.alternativeFeature selection using the Wrapper approach for hierarchical multi-label classificationpt_BR
dc.typemasterThesispt_BR
dc.description.resumoO avanço tecnológico traz como consequência um grande desafio, que é o de encontrar uma forma de armazenar e extrair conhecimento útil de uma massa de dados. Uma alternativa para esse cenário é a utilização de ferramentas da Mineração de Dados, sendo uma das técnicas empregadas, a Seleção de Atributos. A Seleção de Atributos é uma das técnicas que podem ser utilizadas para a redução de dimensionalidade de base de dados, tendo como objetivo principal identificar os atributos relevantes aumentando assim o poder preditivo do classificador. Basicamente, são três as abordagens para a Seleção de Atributos: Embutida, Filtro e Wrapper. No contexto de classificação hierárquica multirrótulo, onde as classes a serem preditas estão estruturadas de acordo com uma hierarquia, poucos trabalhos na literatura apresentam propostas de técnicas de seleção de atributos. Desse modo, neste trabalho propõe-se um novo método de seleção de atributos baseado na abordagem Wrapper para classificação hierárquica multirrótulo global. O método FSW-HMC é dividido em duas etapas principais, sendo estas a estratégia de busca (Sistema Imunológico Artificial e Algoritmo Genético) e avaliação do subconjunto (classificador hierárquico multirrótulo Clus-HMC e medida de desempenho AUPRC). Para a realização dos experimentos são utilizados dados biológicos de 10 bases de dados da Ontologia Gênica, sendo que as classes das mesmas estão estruturadas em uma hierarquia no formato de um Grafo Acíclico Direcionado (DAG). Ao realizar-se a análise dos subconjuntos gerados pode-se notar que houve uma redução significativa do número de atributos superior a 63%. Após a análise dos subconjuntos, pode-se observar que a diferença da medida AUPRC obtida nos subconjuntos para a base com todos os atributos é inferior a 0,025.pt_BR
dc.degree.localPonta Grossapt_BR
dc.degree.datePonta Grossapt_BR
dc.publisher.localPonta Grossapt_BR
dc.creator.Latteshttp://lattes.cnpq.br/5130530343890150pt_BR
dc.contributor.advisor1Borges, Helyane Bronoski-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8340106221427112pt_BR
dc.contributor.referee1Nievola, Júlio César-
dc.contributor.referee2Almeida, Simone de-
dc.contributor.referee3Borges, Helyane Bronoski-
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computaçãopt_BR
dc.publisher.initialsBrasilpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.subject.capesCiência da Computaçãopt_BR
Aparece nas coleções:PG - Programa de Pós-Graduação em Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
PG_PPGCC_M_Almeida, Thissiany Beatriz_2018.pdf11,35 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.