Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/27606
Título: | Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida |
Título(s) alternativo(s): | The use of KDD methodology to discover knowledge in data related to drug dependence andsuicide ideation |
Autor(es): | Kacuta, Stephanie Luri |
Orientador(es): | Santos, Bruno Samways dos |
Palavras-chave: | Mineração de dados (Computação) Vício em drogas Comportamento suicida Data mining Drug addiction Suicidal behavior |
Data do documento: | 2-Dez-2021 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Londrina |
Citação: | KACUTA, Stephanie Luri. Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Londrina, 2021. |
Resumo: | A ideação suicida é uma questão de extrema importância que afeta todas as raças e países. Atualmente, há lacunas de estudos de aplicação da metodologia KDD relacionando à influência da toxicodependência na ideação suicida. O seguinte trabalho tem como objetivo a descoberta de conhecimento em dados utilizando técnicas para a predição de ideação suicida. Para o aprendizado de máquina aplicaram-se as técnicas de classificação Árvore de Decisão e Floresta Aleatória, e para partição de dados, o método de kfold com 10 subconjuntos. A base de dados utilizada é uma base americana pertencente à Pesquisa Nacional sobre Uso de Drogas e Saúde (National Survey on Drug Use and Health NSDUH), foram exploradas 5.055 instâncias e 19 atributos pertencentes às dimensões demográficas, saúde mental e toxicodependência, dados do ano de 2019 e 2020. Três experimentos foram realizados, todos aplicando as duas técnicas de classificação a fim de analisar os diferentes comportamentos do modelo, alternando as dimensões dos atributos. O melhor desempenho foi encontrado no experimento 1 com o conjunto de dados contendo todas as dimensões, aplicando-se a técnica de Árvore de decisão, a qual apresentou 63,7% de acurácia, 55,2% de precisão e 49,1% de recall. Não foi possível observar uma influência considerável relacionada à toxicodependência no conjunto de dados. Em maior parte dos resultados dos experimentos, a técnica que teve melhor desempenho foi a Árvore de decisão. Porém, constatou-se que a porcentagem de predição correta ainda foi baixa, abrindo oportunidades para futuros trabalhos na área com a análise de novos parâmetros, técnicas e pré-processamento das informações que possam melhorar a predição. |
Abstract: | Suicidal ideation is an extremely important issue that affects all races and countries. Currently, there are gaps in studies on the application of the KDD methodology relating to the influence of drug addiction on suicidal ideation. The following work aims to discover knowledge in data using techniques for the prediction of suicidal ideation. For machine learning, the Decision Tree and Random Forest classification techniques were applied, and for data partition, the kfold method with 10 subsets. The database used is an American database belonging to the National Survey on Drug Use and Health (NSDUH), 5,055 instances and 19 attributes belonging to the demographic dimensions, mental health and drug addiction were explored, data from the year 2019 and 2020. Three experiments were carried out, all applying the two classification techniques in order to analyze the different behaviors of the model, alternating the dimensions of the attributes. The best performance was found in experiment 1 with the dataset containing all dimensions, applying the Decision Tree technique, which showed 63.7% accuracy, 55.2% precision and 49.1% recall. It was not possible to observe a considerable influence related to drug addiction in the dataset. In the majority of the experiments results, the technique that performed best was the Decision Tree. However, it was found that the percentage of correct prediction was still low, opening up opportunities for future work in the area with the analysis of new parameters, techniques and preprocessing of information that can improve prediction. |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/27606 |
Aparece nas coleções: | LD - Engenharia de Produção |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
kddtoxicodependenciaideacaosuicida.pdf | 333,74 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.