COMPARISON OF ACCURACY LEVELS OF RANDOM FOREST AND K-NEAREST NEIGHBOR (KNN) ALGORITHMS FOR CLASSIFYING SMOOTH BANK CREDIT PAYMENTS

  • Bayu Aji Santoso PJJ Masters in Informatics Engineering, Universitas AMIKOM Yogyakarta
  • Kusrini PJJ Masters in Informatics Engineering, Universitas AMIKOM Yogyakarta
  • Anggit Dwi Hartanto PJJ Masters in Informatics Engineering, Universitas AMIKOM Yogyakarta
Keywords: Comparison, KNN, Credit, Giving, Random Forest

Abstract

Providing credit is one of the bank offers offered to customers, but extending credit to customers who are not appropriate can cause problems such as customers who do not pay installments on time and even delay payment of installments for several months until bad credit occurs so that this can be detrimental to the bank. Therefore, in this study a comparative method will be carried out to find out which method is the best in classifying the smoothness of bank credit payments. It is hoped that the results of the research can be used as material for consideration by the bank in the selection of bank credit customers. In this study using a dataset from the UCI Machine Learning Repository, the credit payment data totaled 29,998. The dataset is split by dividing 70% train data and 30% test data with the amount of each data, namely 24000 train data and 6000 test data. Meanwhile, the labels used are Eligible and Ineligible. In this study, implementing the data mining process using the CRISP-DM framework and using the Python programming language. From the results of the evaluation using the confusion matrix, the best accuracy value was obtained for the random forest algorithm, namely 82.22%, precision of 80.44%, recall of 82.22% and f1-score of 80.0%. Meanwhile, the KNN algorithm obtains an accuracy value of 81.55%, a precision of 79.5%, a recall of 81.55% and an f1-score of 79.11%. Based on the results of this evaluation, the Random Forest algorithm has the best accuracy compared to the KNN algorithm in classifying bank credit payments.

Downloads

Download data is not yet available.

References

P. Subarkah, E. P. Pambudi dan S. O. N. Hidayah, “Perbandingan Metode Klasifikasi Data Mining untuk Nasabah Bank Telemarketing,” Matrik: Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer, vol. 20, pp. 139-148, 2020.

Farida Gultom dan T. S. , “Prediksi Tingkat Kelancaran Pembayaran Kredit Bank Dengan Menggunakan Algoritma Naïve Bayes Dan K-Nearest Neighbor,” METHOMIKA: Jurnal Manajemen Informatika & Komputerisasi Akuntansi, vol. 4, pp. 1-5, 2020.

D. Hartono, L. W. Santoso dan S. Rostianingsih, “Sistem Pendukung Keputusan Pemberian Kredit berdasarkan Klasifikasi Kelancaran Pembayaran Kredit,” JURNAL INFRA, vol. 10, no. 2, pp. 226-232, 2022.

E. Ndruru dan T. Zebua, “Penerapan Algoritma Nearest Neighbor Dalam Memprediksi Kelayakan Penerimaan Kartu Kredit Pada Bank Cimb Niaga,” Jurnal METHODIKA, vol. 5, no. 1, pp. 1-6, 2019.

W. Hidayat dan A. M. Utami, “Penerapan Metode Algoritma C4.5 Untuk Menentukan Kelayakan Calon Nasabah Pemegang Kartu Kredit Bank Mega Card center Kuningan,” TeknoIS : Jurnal Ilmiah Teknologi Informasi dan Sains, vol. 12, no. 1, pp. 31-48, 2022.

E. Wijaya, F. A. Tarigan dan Michael, “Aplikasi Prediksi Penentuan Kelancaran Pembayaran Koperasi Dengan Algoritma C5.0,” Jurnal TIMES, vol. 10, no. 1, pp. 31-38, 2021.

M. Maulidah, W. Gata, R. Aulianita dan C. I. Agustyaningrum, “Algoritma Klasifikasi Decision Tree Untuk Rekomendasi Buku Berdasarkan Kategori Buku,” JURNAL ILMIAH EKONOMI DAN BISNIS, pp. 89 - 96, 2020.

Marsono, A. H. Nasyuha, S. N. Arif, M. Zunaidi dan N. Y. L. Gaol, “Implementasi Algoritma K-Nearest Neighbor Dalam Mendiagnosis Kurap Pada Kucing,” Journal of Computer System and Informatics (JoSYC), vol. 4, no. 1, pp. 61-65, 2022.

A. K. B. Ginting, M. S. Lydia dan E. M. Zamzami, “Peningkatan Akurasi Metode K-Nearest Neighbor dengan Seleksi Fitur Symmetrical Uncertainty,” JURNAL MEDIA INFORMATIKA BUDIDARMA, vol. 5, pp. 1714-1719, 2021.

U. Erdiansyah, A. I. Lubis dan K. Erwansyah, “Komparasi Metode K-Nearest Neighbor dan Random Forest Dalam Prediksi Akurasi Klasifikasi Pengobatan Penyakit Kutil,” JURNAL MEDIA INFORMATIKA BUDIDARMA, vol. 6, pp. 208-214, 2022.

I. Ubaedi dan Y. M. Djaksana, “Optimasi Algoritma C4.5 Menggunakan Metode Forward Selection Dan Stratified Sampling Untuk Prediksi Kelayakan Kredit,” JSiI | Jurnal Sistem Informasi, pp. 17-26, 2022.

E. Fauziah dan A. F. Zulfikar, “Penerapan Metode Decision TreeMenggunakan Algoritma Iterative Dichotomiser3 (ID3) Untuk Klasifikasi Resiko Penyakit Jantung,” OKTAL : Jurnal Ilmu Komputer dan Science, vol. 2, no. 4, pp. 1207-1219, 2023.

A. Ramadhan, B. Susetyo dan I. , “Penerapan Metode Klasifikasi Random Forest Dalam Mengidentifikasi Faktor Penting Penilaian Mutu Pendidikan,” Jurnal Pendidikan dan Kebudayaan, pp. 169-182, 2019.

C. A. Rahardja, T. Juardi dan H. Agung, “Implementasi Algoritma K-Nearest Neighbor Pada Website Rekomendasi Laptop,” Jurnal Buana Informatika, pp. 75-84, 2019.

V. Angkasa dan J. J. Pangaribuan, “Komparasi Tingkat Akurasi Random Forest Dan Knn Untuk Mendiagnosis Penyakit Kanker Payudara,” Information System Development, vol. 7, no. 1, pp. 49-62, 2022.

Q. Iman dan A. W. Wijayanto, “Klasifikasi Rumah Tangga Penerima Beras Miskin (Raskin)/Beras Sejahtera (Rastra) di Provinsi Jawa Barat Tahun 2017 dengan Metode Random Forest dan Support Vector Machine,” JUSTIN (Jurnal Sistem dan Teknologi Informasi), vol. 9, pp. 178-184, 2021.

D. Sartika dan I. Saluza, “Penerapan Metode Principal Component Analysis (PCA) Pada Klasifikasi Status Kredit Nasabah Bank Sumsel Babel Cabang KM 12 Palembang Menggunakan Metode Decision Tree,” GENERIC Jurnal Ilmu Komputer dan Teknologi Informasi, vol. 14, pp. 45-49, 2022.

H. Azis, Purnawansyah dan F. Fattah, “Performa Klasifikasi K-NN dan Cross-validation pada Data Pasien Pengidap Penyakit Jantung,” Jurnal Ilmiah, vol. 12, no. 2, -ISSN 2548-7779, pp. .81-86, 2020.

G. I. E. Soen, M. dan R. , “Implementasi Cloud Computing dengan Google Colaboratory Pada Aplikasi Pengolah Data Zoom Participants,” JITU : Journal Informatic Technology And Communication, pp. 24-30, 2022.

R. N. Melinda, L. M. Ningrum, I. B. Suryabrata, G. S. B. A. Dwipa dan T. P. Sukoco, “Program Perhitungan RAB Pekerjaan Struktur Baja (WF BEAM) Menggunakan Bahasa Python,” TIERS Information Technology Journal, pp. 31-38, 2021.

D. Sartika dan I. Saluza, “Penerapan Metode Principal Component Analysis (PCA) Pada Klasifikasi Status Kredit Nasabah Bank Sumsel Babel Cabang KM 12 Palembang Menggunakan Metode Decision Tree,” GENERIC Jurnal Ilmu Komputer dan Teknologi Informasi, vol. 15, pp. 45-49, 2022.

F. Gultom dan T. Simanjuntak, “Prediksi Tingkat Kelancaran Pembayaran Kredit Bank Dengan Menggunakan Algoritma Naïve Bayes Dan K-Nearest Neighbor,” METHOMIKA: Jurnal Manajemen Informatika & Komputerisasi Akuntansi, vol. 4, pp. 1-45, 2020.

Published
2024-01-31
How to Cite
[1]
B. Aji Santoso, K. Kusrini, and A. D. Hartanto, “COMPARISON OF ACCURACY LEVELS OF RANDOM FOREST AND K-NEAREST NEIGHBOR (KNN) ALGORITHMS FOR CLASSIFYING SMOOTH BANK CREDIT PAYMENTS”, J. Tek. Inform. (JUTIF), vol. 5, no. 1, pp. 77-87, Jan. 2024.