PENGARUH METODE PENGUKURAN JARAK DAN SMOTE PADA KLASIFIKASI PENILAIAN KREDIT
DOI:
https://doi.org/10.36595/jire.v7i2.1213Keywords:
bad credit, classification, KNN, distance matrix, SMOTEAbstract
Kredit berperan penting untuk menunjang pertumbuhan ekonomi masyarakat. Meski demikian, pengguna kartu kredit diingatkan untuk menggunakan kartu kredit secara bijak sesuai kebutuhan, dan selalu melakukan pembayaran tepat waktu sesuai tagihan yang telah ditetapkan, guna menghindari masalah kredit macet Untuk mengatasi masalah tersebut dibutuhkan sebuah pembelajaran mesin yang mampu mendeteksi sedini mungkin terhadap akun kartu kredit yang beresiko tinggi menjadi krusial untuk mengurangi kerugian yang disebabkan oleh pembayaran kredit macet.penelitian kali ini mengusulkan pengembangan Teknik dalam mechine learning untuk membantu mengklasifikasi kredit macet dengan menggunakan algoritma KNN dengan mengacu kepada penelitian sebelumnya mengenai pengukuran matrix jarak. Dataset German credit data yang di dapatkan dari UCI Mechine Learning memiliki imbalance class Dimana jumlah class positif lebih besar dari class negative. Dari pengujian menggunakan berbagai metode pengukuran jarak serta dengan penerapan SMOTE. Pengujian menunjukkan penanganan ketidakseimbangan kelas menggunakan algoritma SMOTE meningkatkan akurasi, presisi, recall, f1-score, dan g-mean pada KNN secara signifikan. Implementasi 5 metode pengukuran jarak menunjukkan bahwa jarak Manhattan memberikan performa terbaik. Jarak Manhattan memberikan hasil akurasi tertinggi sebesar 84% setelah dilakukan penerapan Teknik SMOTE pada pengujian K = 5, sementara jarak Canberra juga menunjukkan performa yang kuat. Metode Manhattan lebih unggul dalam memberikan hasil klasifikasi yang akurat dibandingkan dengan metode lainnya.
References
E. Ajeng, A. Putri, E. Nuraina, and E. E. Yusdita, “Upaya Pencegahan dan Penanganan Kredit Macet Ditinjau dari Persepsi Nasabah,” Jurnal Riset Akuntansi dan Perpajakan), vol. 7, no. 2, pp. 185–196, 2020.
R. R. A. S. P. P. Putri Ayu Mardhiyah1, “Klasifikasi Untuk Memprediksi Pembayaran Kartu Kredit Macet Menggunakan Algoritma C4.5,” Jurnal Teknologia, vol. 3, pp. 2654–5683, 2020, Accessed: Feb. 07, 2024. [Online]. Available: https://aperti.e-journal.id/teknologia/article/view/66/44
J. Prasetya, “Penerapan Klasifikasi Naive Bayes Dengan Algoritma Random Oversampling Dan Random Undersampling Pada Data Tidak Seimbang Cervical Cancer Risk Factors,” Leibniz?: Jurnal Matematika, vol. 2, no. 2, pp. 11–22, 2022.
M. Mustaqim, B. Warsito, and B. Surarso, “Combination of synthetic minority oversampling technique (Smote) and backpropagation neural network to handle imbalanced class in predicting the use of contraceptive implants,” Register: Jurnal Ilmiah Teknologi Sistem Informasi, vol. 5, no. 2, pp. 116–127, Jul. 2019, doi: 10.26594/register.v5i2.1705.
M. Sulistiyono, Y. Pristyanto, S. Adi, and G. Gumelar, “Implementasi Algoritma Synthetic Minority Over-Sampling Technique untuk Menangani Ketidakseimbangan Kelas pada Dataset Klasifikasi,” SISTEMASI, vol. 10, no. 2, p. 445, May 2021, doi: 10.32520/stmsi.v10i2.1303.
I. M. K. Karo, A. Khosuri, and R. Setiawan, “Effects of Distance Measurement Methods in K-Nearest Neighbor Algorithm to Select Indonesia Smart Card Recipient,” 2021 International Conference on Data Science and Its Applications (ICoDSA), pp. 209–214, 2021, [Online]. Available: https://api.semanticscholar.org/CorpusID:244841914
I. M. Karo Karo, A. Khosuri, J. S. I. Septory, and D. P. Supandi, “Pengaruh Metode Pengukuran Jarak pada Algoritma k-NN untuk Klasifikasi Kebakaran Hutan dan Lahan,” Jurnal Media Informatika Budidarma, vol. 6, no. 2, p. 1174, Apr. 2022, doi: 10.30865/mib.v6i2.3967.
R. Siringoringo, “Klasifikasi Data Tidak Seimbang Menggunakan Algoritma Smote Dan K-Nearest Neighbor,” Journal Information System Development (ISD), vol. 3, no. 1, pp. 44–49, 2018.
D. Bencana and A. Akhlaqul, “Kinerja Metode C4.5 dalam Penyaluran Bantuan,” Prosiding Seminar Nasional Ilmu Komputer dan Teknologi Informasi, vol. 3, no. 2, 2018.
L. Setiyani, M. Wahidin, D. Awaludin, and S. Purwani, “Analisis Prediksi Kelulusan Mahasiswa Tepat Waktu Menggunakan Metode Data Mining Naïve Bayes?: Systematic Review,” Faktor Exacta, vol. 13, no. 1, p. 35, Jun. 2020, doi: 10.30998/faktorexacta.v13i1.5548.
P. Mayadewi and E. Rosely, “Prediksi Nilai Proyek Akhir Mahasiswa Menggunakan Algoritma Klasifikasi Data Mining,” 2015. [Online]. Available: https://www.researchgate.net/publication/283570705
E. Sutoyo, M. Asri Fadlurrahman, J. Telekomunikasi Jl Terusan Buah Batu, K. Dayeuhkolot, K. Bandung, and J. Barat, “Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Television Advertisement Performance Rating Menggunakan Artificial Neural Network,” Jurnal Edukasi & Penelitian Informatika (JEPIN), vol. 6, no. 3, pp. 379–385, 2020.
S. Mulyati, S. Maulana Husein, and K. Kunci, “Rancang Bangun Aplikasi Data Mining Prediksi Kelulusan Ujian Nasional Menggunakan Algoritma (KNN) K-Nearest Neighbor Dengan Metode Euclidean Distance Pada SMPN 2 PAGEDANGAN sistem dapat memprediksi dan mengklasifikasikan dengan baik dan cepat,” pp. 65–73, 2020.
S. Gultom, S. Sriadhi, M. Martiano, and J. Simarmata, “Comparison analysis of K-Means and K-Medoid with Ecluidience Distance Algorithm, Chanberra Distance, and Chebyshev Distance for Big Data Clustering,” in IOP Conference Series: Materials Science and Engineering, Institute of Physics Publishing, Oct. 2018. doi: 10.1088/1757-899X/420/1/012092.
É. O. Rodrigues, “Combining Minkowski and Chebyshev: New distance proposal and survey of distance metrics using k-nearest neighbours classifier,” 2018. [Online]. Available: www.elsevier.com/locate/patrec
M. Nishom, “Perbandingan Akurasi Euclidean Distance, Minkowski Distance, dan Manhattan Distance pada Algoritma K-Means Clustering berbasis Chi-Square,” Jurnal Informatika: Jurnal Pengembangan IT, vol. 4, no. 1, pp. 20–24, Jan. 2019, doi: 10.30591/jpit.v4i1.1253.
H. Azis, P. Purnawansyah, F. Fattah, and I. P. Putri, “Performa Klasifikasi K-NN dan Cross Validation pada Data Pasien Pengidap Penyakit Jantung,” ILKOM Jurnal Ilmiah, vol. 12, no. 2, pp. 81–86, 2020, doi: 10.33096/ilkom.v12i2.507.81-86.
E. E. Ragil Dimas Himawan, “JEPIN (Jurnal Edukasi dan Penelitian Informatika) Perbandingan Akurasi Analisis Sentimen Tweet terhadap Pemerintah Provinsi DKI Jakarta di Masa Pandemi,” jurnal edukasi & penelitian informatika (JEPIN), vol. 7, no. 2, 2021, [Online]. Available: https://dx.doi.org/10.26418/jp.v7i1.41728
R. Sumanti, P. Studi Sistem Informasi, U. Darwan Ali Jln Batu Berlian No, and S. -Kalimantan Tengah, “Klasifikasi Data Tingkat Kerawanan Kebakaran Menggunakan Algoritma CART,” Jurnal Informatika & Rekayasa Elektronika), vol. 7, no. 1, pp. 51–59, 2024, [Online]. Available: http://e-journal.stmiklombok.ac.id/index.php/jire
A. Setiawan, R. Febrio Waleska, M. Adji Purnama, and L. Efrizoni, “KOMPARASI ALGORITMA K-NEAREST NEIGHBOR(K-NN), SUPPORT VECTOR MACHINE(SVM), DAN DECISION TREE DALAM KLASIFIKASI PENYAKIT STROKE,” Jurnal Informatika & Rekayasa Elektronika), vol. 7, no. 1, pp. 107–114, 2024, [Online]. Available: http://e-journal.stmiklombok.ac.id/index.php/jireISSN.2620-6900
Published
Issue
Section
License
Semua tulisan pada jurnal ini menjadi tanggungjawab penuh penulis.