
Please use this identifier to cite or link to this item:
https://repositorio.uide.edu.ec/handle/37000/7834
Title: | Técnicas de minería de datos aplicadas a la predicción de fraude en tarjetas de crédito |
Authors: | Lituma Perero, Freddy Gonzalo Ortega Salas, Iván Patricio Suárez León, Juan Carlos Varela Tapia, Eleanor Alexandra Cortés López, Alejandro (tutor) Rodríguez Chivatá, Jefferson (tutor) |
Keywords: | PREDICCIÓN;FRAUDE;TARJETAS DE CRÉDITO;MINERÍA DE DATOS |
Issue Date: | 2024 |
Publisher: | QUITO/UIDE/2024 |
Citation: | Lituma Perero, Freddy Gonzalo; Ortega Salas, Iván Patricio; Suárez León, Juan Carlos; Varela Tapia, Eleanor Alexandra. (2024). Técnicas de minería de datos aplicadas a la predicción de fraude en tarjetas de crédito. Maestría en Ciencia de Datos y Maquinaria. UIDE. Quito. 146 p. |
Abstract: | El fraude en tarjetas de crédito pone en peligro a los consumidores y a las entidades financieras, empleando datos no permitidos para llevar a cabo operaciones fraudulentas, provocando pérdidas financieras y perjudicando la confianza del usuario. Con el crecimiento de los pagos con tarjetas de crédito, las estrategias de los delincuentes se han agudizado, aumentando la demanda de sistemas sofisticados de identificación y prevención de fraudespor lo que se necesita la aplicación de modelos predictivos de aprendizaje automático para detectar y minimizar estos fraudes, salvaguardando a las instituciones financieras y a sus consumidores. El objetivo del proyecto es el desarrollo de modelos predictivos de detección de fraudes mediante técnicas de minería de datos para la identificación de transacciones fraudulentas en tarjetas de crédito con alta precisión. Durante el entrenamiento de los modelos se aplicó la metodología del proceso KDD, haciendo uso de técnicas de preprocesamiento de datos, algoritmos de aprendizaje supervisado, evaluación de los modelos con métricas de clasificación. Adicionalmente, se usaron técnicas de optimización con RandomSearchCV y validación cruzada para selección de los hiperparámetros que evite el sobreajuste de los modelos y poder generalizar los hallazgos de la predicción frente a datos nuevos. Como resultado se obtuvo la predicción de fraude en una aplicación web local mediante los 3 mejores modelos entrenados con los algoritmos de Árbol de decisión con accuracy 0.977, auc 0.961, falsos negativos 13; Random Forest con accuracy 0.987, auc 0.968, falsos negativos 20 y Gradient Boosting con accuracy 0.989, auc 0.973, falsos negativos 17. Credit card fraud endangers consumers and financial institutions by using unauthorized data to carry out fraudulent transactions, causing financial losses and damaging user confidence. With the growth of credit card payments, criminals' strategies have become more sophisticated, increasing the demand for sophisticated fraud identification and prevention systems, requiring the application of predictive machine learning models to detect and minimize these frauds, safeguarding financial institutions and their consumers. The objective of the project is to develop predictive fraud detection models using data mining techniques to identify fraudulent credit card transactions with high accuracy. During model training, the KDD process methodology was applied, making use of data preprocessing techniques, supervised learning algorithms, model evaluation with classification metrics. Additionally, optimization techniques with RandomSearchCV and cross validation were used to select the hyperparameters to avoid overfitting the models and to generalize the prediction findings to new data. As a result, fraud prediction in a local web application was obtained using the 3 best models trained with the algorithms Decision Tree with accuracy 0.977, auc 0.961, false negatives 13; Random Forest with accuracy 0.987, auc 0.968, false negatives 20 and Gradient Boosting with accuracy 0.989, auc 0.973, false negatives 17. |
URI: | https://repositorio.uide.edu.ec/handle/37000/7834 |
Appears in Collections: | Tesis - Maestría - en Ciencia de Datos y Máquinas de Aprendizaje |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
UIDE-Q-TCDM-2024-03.pdf | TESIS A TEXTO COMPLETO | 5.31 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.