Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/15997
Título: Análise de perfis de doenças com base em técnicas de descoberta de conhecimento em bases de dados
Título(s) alternativo(s): Knowledge discovery in databases of eletronic medical records
Autor(es): Silva, Kaique Augusto Moraes da
Orientador(es): Borges, André Pinz
Palavras-chave: Doenças - Classificação
Registros médicos
Saúde pública
Mineração de dados (Computação)
Diseases - Classification
Medical records
Public health
Data mining
Data do documento: 10-Jun-2019
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Ponta Grossa
Citação: SILVA, Kaique Augusto Moraes da. Análise de perfis de doenças com base em técnicas de descoberta de conhecimento em bases de dados. 2019. 65 f. Trabalho de Conclusão (Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019.
Resumo: Este trabalho tem como objetivo fazer análises de perfis de doenças com base em técnicas de descoberta do conhecimento de bases de dados do prontuário eletrônico do paciente da rede pública. A descoberta de informações correlacionadas em prontuários pode ser uma tarefa complexa e de longa duração para profissionais da área da saúde, principalmente quando a quantidade de dados é de grande porte ou quando sem auxílio de sistemas computacionais especializados. O processo de descoberta do conhecimento pode ser uma alternativa para obtenção de um conhecimento especializado a partir da interpretação dos dados e transformá-los em conhecimento útil na área da saúde. Para isto, foi utilizado um banco de dados de prontuários eletrônicos de usuários do sistema único de saúde que possui 43.879 pacientes e 2.296.626 atendimentos feitos no ano de 2015 no município de Pato Branco, Paraná. Neste trabalho foi feito a descoberta de conhecimento afim de encontrar perfis de doenças utilizando as ferramentas PostgreSQL para utilização do banco de dados, os algoritmos j48, bagging e boosting, com a ferramenta WEKA. Todas tecnologias empregadas são de utilização pública. O resultado foi a obtenção e dois grupos de doenças, neoplasias que possuem 119 instâncias e traumatismos que por sua vez possui 236 instâncias, para a aplicação dos algoritmos de mineração de dados com uma seleção de 17 atributos totais. Onde o melhor desempenho foi com a execução do algoritmo Boosting para classificar. As regras geradas pela árvore de decisão sobre as doenças do grupo de neoplasias tiveram principais ramos bairro, peso, frequência escolar, faixa etária e altura. Já para o grupo de doenças de traumatismos as principais regras foram sobre bairro, peso, altura, faixa etária, sexo, diabetes e se fumavam. Com base nos resultados é possível fazer uma análise de um especialista da área da saúde para confirmar essas regras geradas possibilitam uma nova obtenção de conhecimento relacionado ao perfil dessas doenças para que seja possível ter uma maior prevenção e concluído a descoberta de conhecimento.
Abstract: This study aims to analyze disease profiles based on techniques for discovering the knowledge of databases of patients' medical records in the public network. The discovery of correlated information in medical records can be a complex and long-term task for health professionals, especially when the amount of data is large or without the aid of specialized computer systems. The process of knowledge discovery can be an alternative to obtain specialized knowledge from the interpretation of data and transform it into useful knowledge in the health area. For this purpose, a database of electronic medical records of users of the single health system was used, which has 43,879 patients and 2,296,626 patients in the city of Pato Branco, Paraná, in the year 2015. In this work, knowledge was discovered in order to find disease profiles using PostgreSQL tools for database use, j48, bagging and boosting algorithms with the WEKA tool. All technologies employed are of public use. The result was the acquisition and two groups of diseases, neoplasms that have 119 instances and trauma that in turn have 236 instances, for the application of the algorithms of data mining with a selection of 17 total attributes. Where the best performance was with running the Boosting algorithm to sort. The rules generated by the decision tree on the diseases of the group of neoplasms had main neighborhood branches, weight, school attendance, age group and height. Already for the group of diseases of injuries the main rules were about neighborhood, weight, height, age group, sex, diabetes and if they smoked. Based on the results it is possible to make an analysis of a specialist in the health area to confirm that the rules generated enable a new knowledge acquisition related to the profile of these diseases so that it is possible to have a greater prevention and complete the discovery of knowledge.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/15997
Aparece nas coleções:PG - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
PG_COCIC_2019_1_08.pdf1,46 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.