Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/15986
Título: Uso de mineração de dados para descoberta de regras de associação em prontuários médicos
Título(s) alternativo(s): Use of data mining for association rules discovery in medical records
Autor(es): Andrade, Lucas Rafael
Orientador(es): Borges, André Pinz
Palavras-chave: Mineração de dados (Computação)
Registros médicos
Administração dos serviços de saúde
Data mining
Medical records
Health services administration
Data do documento: 11-Nov-2019
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Ponta Grossa
Citação: ANDRADE, Lucas Rafael. Uso de mineração de dados para descoberta de regras de associação em prontuários médicos. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019.
Resumo: Este trabalho tem como objetivo a extração de regras de associação através de técnicas de mineração de dados em uma base de dados de prontuários eletrônicos. As regras de associação tornam-se, após análise, informação útil para o profissional da área da saúde. O processo de descoberta de informações em prontuários pode ser demorado e complexo para o profissional sem o auxílio da tecnologia especializada para o processo. Para tal, a execução dos processos de descoberta de conhecimentos em bases de dados se mostra uma opção viável para adquirir informações e conhecimento útil. A base de dados utilizada neste trabalho compreende prontuários eletrônicos referentes a 43.879 pacientes usuários do sistema único de saúde e um total de 2.296.626 atendimentos realizados no ano de 2015 na cidade de Pato Branco, Paraná. Para realização do processo de preparação dos dados foi utilizado o software PostgreSQL, onde é possível manipular e realizar alterações ao banco de dados e para a aplicação dos algoritmos Apriori e Hotspot na etapa de Mineração de Dados foi utilizado o WEKA. Realizou-se experimentos com a aplicação de Apriori onde compara-se a discrepância de regras usando a métrica de confiança com a utilização da métrica lift. Os resultados do experimento evidenciaram regras de associação que não seriam visualizadas através da execução do algoritmo considerando somente a métrica de confiança. Com os resultados dos experimentos, foi inspirada uma escolha de atributos para a execução do algoritmo Hotspot, onde, primeiramente, foi observada as diferenças de doenças entre o sexo masculino e feminino. Também foi traçado o perfil de cada uma das faixas etárias presentes na base de dados, onde foram encontradas doenças que não apareceriam numa execução do Apriori, especialmente em faixas de 18 anos para cima. Foi realizada a execução do algoritmo Hotspot também para três grupos de doenças que apareceram dentre as faixas etárias. Os grupos estavam relacionados a dorsopatias, hipertensão e doenças médias no ouvido e mastóide. Das regras obtidas, pôde-se fortalecer a relação dentre as doenças e as faixas etárias das quais elas foram baseadas como também encontrar outras faixas etárias onde ocorrências e correlacionar o grupo de doenças com outros sintomas, especificando o perfil traçado das doenças. Para a conclusão do processo de descoberta de conhecimentos, mostra-se necessário a análise de um profissional da área da saúde sobre as informações obtidas a partir da aplicação de mineração de dados.
Abstract: This study aims to extract association rules in a medical records database through data mining techniques. Association rules can become useful information for health professionals, after analysis. For professionals, the information discovery in medical records can be complex and long without specialized technology’s aid on the process. For this purpose, the application of knowledge discovery in databases shows an viable option for acquiring useful knowledge and information. The database used in this study consists of medical records about 43.879 patients and 2.296.626 health care attendances, on the year of 2015, in Pato Branco city, Paraná. The PostgreSQL software was used for the purpose of data preparation, where you can alter the database, whereas WEKA was used for data mining application of the Apriori and Hotspot algorithms. Tests where the difference between the use of the confidence metric and the lift metric in the Apriori algorithm were made. The results showed association rules that wouldn’t be seen by considering the confidence metric Apriori application only. Using the results, attributes were then chosen for the Hotspot algorithm application, were, first the difference between disease groups from the male and female genders. Profiles for the age gaps that appeared on the database were made and the application found disease groups that wouldn’t appear on the Apriori application, such as age gaps from 18 years and above. The Hotspot application was then used for profiling three disease groups which appeared between the age gaps. The groups were related to back pain, ear and mastoid diseases and hypertension. From the association rules obtained, the relation between age gaps and disease groups was made clearer, with the rules even finding some different age gaps for diseases. The application also related the diseases with other symptoms, narrowing down the profiling for the diseases. The analysis of an health professional would be necessary for the conclusion of the study results, where the rules could then become useful knowledge.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/15986
Aparece nas coleções:PG - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
PG_COCIC_2019_2_12.pdf1,33 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.