Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/35498
Título: Aplicação de um modelo de aprendizado de máquina enviesado: detecção de fraudes em transações de cartão de crédito no comércio eletrônico
Autor(es): Cardoso, Murilo Kenji
Orientador(es): Lima, Matheus Garibalde Soares de
Palavras-chave: Comércio eletrônico
Fraude no cartão de crédito - Detecção
Análise de regressão logística
Aprendizado do computador
Electronic commerce
Credit card fraud - Detection
Logistic regression analysis
Machine learning
Data do documento: 11-Nov-2022
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: CARDOSO, Murilo Kenji. Aplicação de um modelo de aprendizado de máquina enviesado: detecção de fraudes em transações de cartão de crédito no comércio eletrônico. 2022. Trabalho de Conclusão de Curso de Especialização (Ciência de Dados e suas Aplicações) - Universidade Tecnológica Federal do Paraná, Curitiba, 2022.
Resumo: O estudo de caso ocorre em um contexto de grande volume de tentativas de fraudes no comércio eletrônico, especificamente cartões de crédito. O trabalho busca criar um modelo de aprendizado de máquina que vise o acerto da classe positiva, atuando como um intermediário para evitar a utilização de modelos ofertados no mercado de prevenção a fraudes. A metodologia aplicada consistiu em tratamento dos dados, seleção das melhores variáveis, correção de desbalanceamento da classe minoritária, aplicação dos algoritmos Random Forest, Regressão Logística e Gradient Boosting, tunagem de hiperparâmetros dos algoritmos, seleção do limiar de classificação e criação de faixas com sugestões de maior ou menor exposição ao risco. Como resultado, foi possível observar um baixo volume de erro da classe positiva e a possibilidade de evitar a utilização de até 80% do modelo de mercado estudado.
Abstract: The case study occurs in a context of high volume of fraud attempts in e-commerce, specifically with credit cards. The work seeks to create a machine learning model that aims to hit the positive class, acting as an intermediary to avoid the use of models offered in the fraud prevention market. The applied methodology consisted of data processing, selection of the best variables, correction of minority class imbalance, application of Random Forest, Logistic Regression and Gradient Boosting algorithms, tuning algorithms’ hyperparameters, selection of threshold and creation of ranges with suggestions of greater or lesser exposure to risk. As a result, it was possible to observe a low volume of error in the positive class and the possibility of avoiding the use of up to 80% of the market model studied.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/35498
Aparece nas coleções:CT - Ciência de Dados e suas Aplicações

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
CT_CCDA_2020_1_08.pdf513,17 kBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.