Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/37726
Título: | Aplicação da metodologia CRISP-DM: um estudo sobre diabetes utilizando bases de dados públicas |
Autor(es): | Santa Clara, João Paulo Pereira Moreira, Murillo Iago |
Orientador(es): | Fidelis, Marcos Vinicius |
Palavras-chave: | Mineração de dados (Computação) Banco de dados Diabetes Data mining Data bases |
Data do documento: | 29-Mai-2024 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Ponta Grossa |
Citação: | SANTA CLARA, João Paulo Pereira; MOREIRA, Murillo Iago. Aplicação da metodologia CRISP-DM: um estudo sobre diabetes utilizando bases de dados públicas. 2024. Trabalho de Conclusão de Curso (Tecnologia em Análise e Desenvolvimento de Sistemas) - Universidade Tecnológica Federal do Paraná, 2024. |
Resumo: | Este estudo tem como objetivo principal explorar a eficácia e relevância do modelo CRISP-DM na análise de dados relacionados à diabetes, com o intuito de desenvolver modelos preditivos que contribuam para o entendimento da doença e suas complicações. Inicialmente, realizou-se uma revisão bibliográfica sobre o uso do CRISP-DM na literatura, destacando sua flexibilidade e capacidade de adaptação a diferentes projetos e conjuntos de dados. Essa fase permitiu uma compreensão detalhada da estrutura e das etapas do modelo, visando a aplicação prática no contexto da diabetes. Em seguida, foram analisados conjuntos de dados públicos sobre diabetes, provenientes de diversas fontes, como cuidados clínicos, registros de qualidade e dados administrativos. Cada fonte foi avaliada quanto às suas principais vantagens e desvantagens, levando em consideração aspectos como qualidade, representatividade e acessibilidade dos dados. Essa análise detalhada proporcionou uma visão abrangente das informações disponíveis e orientou a seleção dos conjuntos de dados mais adequados para o estudo. Durante o processo de análise, foi elaborada uma documentação das fases do modelo CRISP-DM, adaptada às necessidades e requisitos específicos do estudo de caso. Essa documentação não apenas descreveu cada etapa do processo, desde a compreensão do negócio até a implantação dos modelos, mas também forneceu orientações práticas para sua execução. Além disso, serviu como uma ferramenta educacional, facilitando a compreensão dos detalhes técnicos do estudo e promovendo a disseminação do conhecimento sobre mineração de dados. Os resultados obtidos do uso do CRISP-DM foram analisados e interpretados em relação aos objetivos estabelecidos no início do estudo. Os modelos preditivos desenvolvidos representam ferramentas que podem auxiliar na identificação de riscos da doença, na implementação de estratégias de prevenção e controle da diabetes e na aplicação de um modelo de processos norteando o processo de construção de classificadores. Em conclusão, este estudo demonstrou que o modelo CRISP-DM é uma abordagem eficaz e abrangente para a análise de dados relacionados à diabetes. Sua aplicação permitiu uma compreensão mais profunda dos padrões e fatores de risco associados à doença, contribuindo significativamente para o avanço do conhecimento na área da saúde e dos processos de mineração de dados. O sucesso deste projeto valida a importância do CRISP-DM como uma ferramenta poderosa para impulsionar futuras pesquisas e inovações no campo da mineração de dados e da saúde pública. |
Abstract: | The main objective of this study is to explore the effectiveness and relevance of the CRISP-DM model in the analysis of diabetes-related data, with the aim of developing predictive models that contribute to the understanding of the disease and its complications. Initially, a literature review on the use of CRISP-DM in the literature was carried out, highlighting its flexibility and ability to adapt to different projects and datasets. This phase allowed a detailed understanding of the structure and stages of the model, aiming at its practical application in the context of diabetes. Next, public datasets on diabetes were analyzed, coming from various sources, such as clinical care, quality registries and administrative data. Each source was evaluated for its main advantages and disadvantages, taking into account aspects such as data quality, representativeness and accessibility. This detailed analysis provided a comprehensive view of the available information and guided the selection of the most appropriate datasets for the study. During the analysis process, a documentation of the phases of the CRISP-DM model was prepared, adapted to the specific needs and requirements of the case study. This documentation not only described each step of the process, from understanding the business to implementing the models, but also provided practical guidance for its execution. In addition, it served as an educational tool, facilitating the understanding of the technical details of the study and promoting the dissemination of knowledge about data mining. The results obtained from the use of CRISP-DM were analyzed and interpreted in relation to the objectives established at the beginning of the study. The predictive models developed represent tools that can assist in the identification of disease risks, in the implementation of diabetes prevention and control strategies, and in the application of a process model to guide the process of building classifiers. In conclusion, this study demonstrated that the CRISP-DM model is an effective and comprehensive approach for the analysis of diabetes-related data. Its application allowed a deeper understanding of the patterns and risk factors associated with the disease, contributing significantly to the advancement of knowledge in the health area and data mining processes. The success of this project validates the importance of CRISP-DM as a powerful tool to drive future research and innovation in the field of data mining and public health. |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/37726 |
Aparece nas coleções: | PG - Tecnologia em Análise e Desenvolvimento de Sistemas |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
metodologiacrispestudodiabetes.pdf | 3,83 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons