Analisis Sistem Pendeteksi Penipuan Transaksi Kartu Kredit dengan Algoritma Machine Learning

Putu Tirta Sari Ningsih, Muhammad Gusvarizon, Rudi Hermawan

Abstract


Meningkatnya jumlah pengguna kartu kredit di indonesia menimbulkan kekhawatiran akan terjadinya tindak penipuan transaksi kartu kredit. Banyaknya volume transaksi dan cepatnya proses transaksi yang berlangsung, membuat tidak mungkin untuk diawasi secara manual oleh manusia. Pengawasan diperlukan untuk melakukan pencegahan terhadap tindak penipuan transaksi kartu kredit. Cara terbaik yang dapat dilakukan adalah dengan memanfaatkan teknologi machine learning dan algoritmanya untuk membuat sebuah sistem yang dapat mendeteksi penipuan transaksi kartu kredit. Dalam machine learning terdapat banyak algoritma yang pada dasarnya memiliki tingkat akurasi dan efisiensi berbeda-beda. Untuk memilih algoritma apa yang paling cocok untuk memecahkan suatu masalah perlu dilakukan perbandingan antar beberapa algoritma. Pada penelitian ini akan diukur performa dari beberapa algoritma machine learning seperti decision tree (DT), random forest (RF), logistic regression (LR), dan support vector machine (SVM) untuk mendeteksi penipuan transaksi kartu kredit menggunakan data transaksi kartu kredit yang didapatkan dari Kaggle. Data yang digunakan berisi 284807 transaksi kartu kredit yang dilakukan oleh pemegang kartu di eropa selama dua hari dengan bobot transaksi normal sebanyak 99,83% dan fraud sebanyak 0,17%. Adapun langkah-langkah yang dilakukan ialah dengan melakukan preprocessing data terlebih dahulu termasuk melakukan oversampling, lalu membuat model tanpa menentukan parameter dan dengan parameter yang ditentukan dengan bantuan fungsi GridSearchCV, melatih model dengan data pelatihan, dan melakukan prediksi menggunakan data tes. Hasil dari penelitian ini yaitu didapatkan bahwa model dengan algoritma random forest memiliki nilai performa paling tinggi secara keseluruhan. Maka berdasarkan hasil tersebut dapat disimpulkan bahwa algoritma random forest adalah algoritma yang paling cocok untuk mendeteksi penipuan transaksi kartu kredit.


Full Text:

PDF

References


Abdou, H., Delamaire, L. & Pointon, J., (2009). Credit Card Fraud And Detection Techniques: A Review. Banks and Banks Systems, 4(2), pp. 57-68.

Abdullah, M., Mohammed, R. & Rawashdeh, J., (2020). Machine Learning with Oversamplind and Undersampling Techniques: Overview Study and Experimental Results. ResearchGate, pp. 1-6.

Anne, B. L., Probst, P. & Wright, M., (2019). Hyperparameters and Tuning Strategies for Random Forest. WIREs Data Mining And Knowledge Discovery, pp. 1-19.

Asha, R. & Kumar, S. K., (2021). Credit Card Fraud Detection Using Artificial Neural Network. Global Transitions Proceedings, Volume 2, pp. 35-41.

Blagus, R. & Lusa, L., (2013). SMOTE for High-Dimensional Class-Imbalanced Data. Blagus and Lusa BMC Bioinformatics, 14(106), pp. 1-16.

Blondel, M. et al., (2011). Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, Volume 12, pp. 2825-2830.

Bowers, A. J. & Zhou, X., (2019). Receiver Operating Characteristic (ROC) Area Under the Curve (AUC): A Diagnostic Measure for Evaluating the Accuracy of Predictors of Education Outcomes. Journal of Education for Students Placed At Risk (JESPAR), 24(1), pp. 1-19.

Breiman, L., (2001). Random Forest. Statistics Department, University of California, Volume 45, pp. 5-32.

Chicco, D. & Jurman, G., (2020). The Advantages Of The Matthews Correlation Coefficient (MCC) Over F1 Score And Accuracy In Binary Classification Evaluation. Chicco and Jurman BMC Genomics, 21(6), pp. 1-13.

Dewi, N. K., Mulyadi, S. Y. & Syafitri, U. D., (2011). Penerapan Metode Random Forest dalam Driver Analysis. Forum Statistika dan Komputasi, 16(1), pp. 35-43.

Dornadula, V. N. & Geetha, S., (2019). Credit Card Fraud Detection Using Machine Learning Algorithms. Procedia Computer Science, Volume 165, pp. 631-641.

Drummond, A. C. & Resende, P. A. A., (2018). A Survey of Random Forest Based Methods for Intrusion Detection Systems. ACM Computing Surveys, 51(3), pp. 1-36.

Elkan, C., Lipton, Z. C. & Naryanaswamy, B., (2014). Thresholding Classifiers to Maximize F1 Score. University of California, pp. 1-16.

Ezukwoke, K. & Zareian, S., (2019). Logistic Regression And Kernel Logistic Regression A Comparative Study Of Logistic Regression And Kernel Logistic Regression For Binary Classification. ResearchGate, pp. 1-10.

Ghamisi, P. et al., (2020). Support Vector Machine Versus Random Forest for Remote Sensing Image Classification: A Meta-Analysis and Systematic Review. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, Volume 13, pp. 6308-6325.

Hamori, S., Kawai, M., Kume, T. & Murakami, Y., (2018). Ensemble Learning or Deep Learning? Application to Default Risk Analysis. Journal of Risk and Financial Management, 11(12), pp. 1-14.

Hao, J. & Ho, T. K., (2019). Machine Learning Made Easy: A Review of Scikit-learn Package in Python Programming Language. Journal of Educational and Behavioral Statistics, 44(3), pp. 348-361.

Hendarsyah, D., (2020). Analisis Prilaku Konsumen Dan Keamanan Kartu Kredit Perbankan. Jurnal Perbankan Syariah, 1(1), pp. 85-96.

Hermuningsih, S., Irmawati & Rahayu, F. A., (2011). Perkembangan Kartu Kredit di Indonesia. Jurnal Manajemen, 1(1), pp. 5-13.

Kavila, K. D. & Lakshmi, S. V. S. S., (2018). Machine Learning For Credit Card Fraud Detection System. International Journal of Applied Engineering Research, 13(24), pp. 16819-16824.

Kurniawan, A. & Yulianingsih, (2021). Pendugaan Fraud Detection pada Kartu Kredit dengan Machine Learning. Kilat, 10(2), pp. 320-325.

LaValley, M. P., (2008). Logistic Regression. Circulation, pp. 2395-2399.

Mahesh, B., (2018). Machine Learning Algorithms - A Review. International Journal of Science and Research, 9(1), pp. 381-386.

Mewengkang, F. R., Ratulangi, C. H. & Wahongan, A. S., (2021). Tindak Pidana Cyber Crime dalam Kegiatan Perbankan. Lex Privatum, 9(5), pp. 179-187.

Panda, R. M. & Sagar, B. S. D., (2022). Decision Tree. Encyclopedia of Mathematical Geosciences, pp. 1-14.

Patel, B. R. & Rana, K. K., (2014). A Survey on Decision Tree Algorithm For Classification. International Journal of Engineering Development and Research, 2(1), pp. 1-5.

Powers, D. M., (2011). Evaluation: From Precision, Recall And F-Measure To ROC, Informedness, Markedness & Correlation. Flinders University, pp. 37-63.

Prasetyo, A. & Sofyan, S., (2021). Penerapan Synthetic Minority Oversampling Technique (SMOTE) Terhadap Data Tidak Seimbang Pada Tingkat Pendapatan Pekerja Informal Di Provinsi D.I. Yogyakarta Tahun 2019. Seminar Nasional Official Statistics, pp. 868-877.

Siringoringo, R., (2018). Klasifikasi Data Tidak Seimbang Menggunakan Algoritma Smote Dan K-Nearest Neighbor. Jurnal Information System Development, 3(1), pp. 44-49.

Subekti, A. & Syukron, A., (2018). Penerapan Metode Random Over-Under Sampling dan Random Forest untuk Klasifikasi Penilaian Kredit. Jurnal Informatika, 5(2), pp. 175-185.

Yazid & Fiananta, A., (2017). Mendeteksi Kecurangan Pada Transaksi Kartu Kredit Untuk Verifikasi Transaksi Menggunakan Metode SVM. Indonesian Journal of Applied Informatics, 1(2), pp. 61-66.




DOI: https://doi.org/10.37012/jtik.v8i2.1306

Refbacks

  • There are currently no refbacks.


Copyright (c) 2022 Putu Tirta Sari Ningsih, Muhammad Gusvarizon, Rudi Hermawan

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Address:
Universitas Mohammad Husni Thamrin
Jl. Raya Pd. Gede No.23-25, RT.2/RW.1, Dukuh, Kec. Kramat jati, Kota Jakarta Timur, Daerah Khusus Ibukota Jakarta 13550

Creative Commons License
Jurnal Teknologi Informatika & Komputer Mohammad Husni Thamrin is licensed under a Creative Commons Attribution 4.0 International License.

View My Stats