Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/12490
Título: Técnicas de mineração de dados para análise de uma base de pacientes com câncer de esôfago no período de 1998 a 2017
Título(s) alternativo(s): Data mining techniques for analysis from a database of esophageal cancer patients from 1998 to 2017
Autor(es): Lorençon, Fernanda
Orientador(es): Gavioli, Alan
Palavras-chave: Análise de componentes principais
Análise por agrupamento
Classificação
Principal components analysis
Cluster analysis
Classification
Data do documento: 21-Nov-2019
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Medianeira
Citação: LORENÇON, Fernanda. Técnicas de mineração de dados para análise de uma base de pacientes com câncer de esôfago no período de 1998 a 2017. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Tecnológica Federal do Paraná, Medianeira, 2019.
Resumo: O câncer é uma doença responsável por milhares de novos casos por ano, no qual são coletados e armazenados dados para acompanhamento de casos e de pacientes da doença. No Brasil esses dados são armazenados em uma base de dados nacional, chamada registros hospitalares de câncer. Dados na área da saúde têm ganhado interesse para utilização na descoberta de conhecimento em bases de dados, portanto este trabalho visou aplicar técnicas de mineração de dados para identificação de padrões relevantes e perfis de pacientes diagnosticados com câncer de esôfago, já que o diagnóstico precoce ´e essencial. Realizando mineração de regras de associação, classificação e agrupamento dos dados e aplicando métodos de seleção de variáveis em variáveis relacionadas a fatores anteriores ao diagnóstico, com auxílio da ferramenta WEKA e a base de dados disponibilizada no integrador de registros hospitalares de câncer. Como resultados, o algoritmo a priori minerou regras de associação, mas acabou influenciado pelos valores predominantes de algumas variáveis. Os algoritmos de classificação, J48 e reptree foram testados com diversas configurações e conseguiram um percentual de acerto satisfatório, cerca de 71%, ao classificar corretamente as instâncias para a classe referente a localização primária do tumor. Os algoritmos de agrupamento de dados, k-means e sobretudo o EM, mostraram bom desempenho ao agrupar avaliando clusters com relação a classe quando utilizados principalmente sem o filtro de instâncias resample. Os métodos aplicados mostraram ser capazes de classificar e agrupar os casos de câncer de esôfago, assim como revelaram padrões interessantes na relação das variáveis selecionadas por métodos de seleção de variáveis.
Abstract: Cancer is a disease responsible for thousands of new cases per year, so data are collected and stored to track cases and patients of the disease. In Brazil this data is stored in a national database called hospital cancer records. Health data has gained interest for use in knowledge discovery in databases, so this work aimed to apply data mining techniques to identify relevant patterns and profiles of patients diagnosed with esophageal cancer, since early diagnosis is essential. Mining rules of association, classification and grouping of data and applying methods of variable selection in variables related to factors prior to diagnosis, with the help of WEKA tool and the database available in the hospital cancer registry integrator. As a result, the apriori algorithm mined association rules, but was eventually influenced by the predominant values of some variables. The classification algorithms, J48 and reptree were tested with several configurations and achieved a satisfactory hit percentage, about 71%, by correctly classifying instances for the class referring to the primary tumor location. Data grouping algorithms, kmeans and especially EM, showed good performance when grouping by evaluating clusters against class when used mainly without the resample instance filter. The applied methods were able to classify and group the esophageal cancer cases, as well as revealing interesting patterns in the relation of the variables selected by variable selection methods.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/12490
Aparece nas coleções:MD - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
mineracaodadospacientescancer.pdf1,54 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.