Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/31685
Registro completo de metadados
Campo DCValorIdioma
dc.creatorAssis, Rhuan Lopes-
dc.date.accessioned2023-07-06T13:15:45Z-
dc.date.available2023-07-06T13:15:45Z-
dc.date.issued2023-06-19-
dc.identifier.citationASSIS, Rhuan Lopes. Detecção de fraudes em cartões de crédito utilizando métodos de baseados em árvores de decisão. 2023. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2023.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/31685-
dc.description.abstractIn 2020, the world was surprised by the arise of the pandemic. Due the social isolation issued by this, Internet purchases had a significant increase, and, with them, fraud attempts has increased as well, especially in credit card purchases. Although the fraud increased, the legit transactions are still expressively bigger, which difficult its detection. With this in mind, is known that fraudulent transactions are considered outliers towards the legit ones. This work aims to utilize tree-based machine learning algorithms, which are easily interpretable models for humans and can be used to detect potential frauds. The dataset was split into training, testing, and validation sets in a stratified manner. The testing set was generated using the largest fraction of the data to create representative models, meaning that a smaller portion of the data was used for training. During the model construction, the data was standardized using the StandardScaler before proceeding to the next steps, which were hyperparameter optimization with BayesianSearch, training the Isolation Forest and ExtraTree models with the found hyperparameters, prediction, and K-fold cross-validation. Finally, to compare the models, the Friedman statistical hypothesis test was applied with a significance level of 95%. Since an extremely significant statistical difference was found, the Nemenyi post-test was applied to determine which pairs of models had a statistically significant difference. As a result, it can be concluded with 95% certainty that the ET models performed better compared to the IF-Matt model. Additionally, the supervised model achieved better classification measures for legitimate transactions, while the unsupervised model excelled in classifying frauds. It can also be observed that models with higher sensitivity had a higher Matthews correlation coefficient.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/pt_BR
dc.subjectInteligência computacionalpt_BR
dc.subjectFraude no cartão de créditopt_BR
dc.subjectAprendizado do computadorpt_BR
dc.subjectComputational intelligencept_BR
dc.subjectCredit card fraudpt_BR
dc.subjectMachine learningpt_BR
dc.titleDetecção de fraudes em cartões de crédito utilizando métodos de baseados em árvores de decisãopt_BR
dc.title.alternativeDetection of credit card fraud using decision tree-based methodspt_BR
dc.typebachelorThesispt_BR
dc.description.resumoEm 2020, o mundo foi surpreendido com o surgimento de uma pandemia. Devido ao isolamento social causado por esta, as compras pela Internet tiveram uma aumento significativo, e, junto a elas, também aumentaram os casos de tentativas de fraude, especialmente em compras com cartão de crédito. Apesar do aumento de fraudes, o número de transações legítimas continua expressivamente maior, o que dificulta sua detecção. Tendo isso em mente, sabe-se que transações fraudulentas são consideradas anomalias perante as legítimas. Este trabalho tem como objetivo a utilização de algoritmos de aprendizado de máquina baseados em árvores de decisão, que são modelos facilmente interpretáveis por humanos e podem ser utilizados para detectar potenciais fraudes. A base foi separada em treino, teste e validação, de forma estratificada. O conjunto de teste foi gerado utilizando a maior fração dos dados, com o objetivo de criar modelos representativos, ou seja, que utilizasse uma menor parcela dos dados para o treinamento. Durante a construção de modelos, os dados foram padronizados via StandardScaler antes das próximas fases, de otimização de hiperparâmetros com o BayesianSearch, treinamento dos modelos Isolation Forest (IF) e ExtraTree (ET) com os hiperparâmetros encontrados, predição e validação cruzada K-fold. Por fim, para a comparação dos modelos, foi aplicado o teste estatístico de hipótese de Friedman considerando o nível de significância de 95%. Como foi constatada diferença estatística extremamente significativa, o pós-teste de Nemenyi foi aplicado para verificar quais pares de modelos tiveram diferença estatisticamente significativa. Como resultado, conclui-se que, com 95% de certeza, que os modelos ETs tiveram desempenho superior em comparação com o modelo IF-Matt. Por fim, o modelo supervisionado obteve melhores medidas de classificação de transações legítimas, enquanto o não supervisionado foi o melhor classificando fraudes. Pode-se também notar que o coeficiente de correlação de Matthews era maior em modelos com sensitividade maior.pt_BR
dc.degree.localPato Brancopt_BR
dc.publisher.localPato Brancopt_BR
dc.contributor.advisor1Oliva, Jefferson Tales-
dc.contributor.advisor-co1Casanova, Dalcimar-
dc.contributor.referee1Oliva, Jefferson Tales-
dc.contributor.referee2Casanova, Dalcimar-
dc.contributor.referee3Wiggers, Kelly Lais-
dc.contributor.referee4Favarim, Fábio-
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentDepartamento Acadêmico de Informáticapt_BR
dc.publisher.programEngenharia de Computaçãopt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
Aparece nas coleções:PB - Engenharia de Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
deteccaofraudearvoresdecisao.pdf3,17 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons