OPTIMASI ALGORITMA K-NEAREST NEIGHBOR DENGAN SELEKSI FITUR MENGGUNAKAN XGBOOST
DOI:
https://doi.org/10.36595/jire.v6i1.723Keywords:
KNN, K Nearest Neighbour, Feature Selection, XGBoostAbstract
Kankergmerupakan istilah umum untuk sekelompokgbesar penyakit yang dapatgmenyerang bagian tubuhgmanagpun. Salah satu kanker yang berbahaya adalah Kankerspayudara. Pencegahanskanker payudarasdapatsdilakukansdengan salah satu cara yaitu skrining atau diagnosa dini. Pendiagnosaan dapat menggunakan Machine learning dengan beberapa algoritma contohnya K-Nearest Neighbor. Algortima klasifikasi K-Nearest Neighbor (K-NN) merupakan algortima yang cukup terkenal dan sering digunakan, tetapi terdapat kelemahan pada algoritma KNN yaitu algoritma ini sangat berpengaruh dengan adanya data yang noise atau tidak relevan jika skala fitur tidak konsisten dengan kepentingannya. Salah satu cara mengatasinya adalah dengan cara menyeleksi fitur. Seleksi fitur yang digunakan yaitu menggunakan Extreme Gradient Boosting (XGBoost) berdasarkan kepentingan fitur yang didapatkan. Hasilnya menunjukkan bahwa KNN dengan seleksi fitur XGBoost menggungguli model KNN tanpa seleksi fitur, untuk nilai KNN dengan seleksi fitur XGBoost mendapatkan akurasi sebesar 0,977 sedangkan KNN tanpa seleksi fitur mendapatkan akurasi sebesar 0,974.
References
Danukusumo, K. P., Implementasi Deep Learning Menggunakan Convolutional Neural Network Untuk Klasifikasi Citra Candi Berbasis Gpu. Universitas Atma Jaya Yogyakarta. 2017.
Baharuddin, M. M., Tafsir H., and Huzain A., Analisis Performa Metode K-Nearest Neighbor Untuk Identifikasi Jenis Kaca. ILKOM Jurnal Ilmiah, Vol. 11, No. 3, pp 269-274.
Pratama, Y.A., Analisis Metode Seleksi Fitur Untuk Meningkatkan Akurasi Pada Variant Metode Klasifikasi K-Nearest Neighbor (KNN). Universitas Sumatera Utara. 2019.
Bode, A., K-Nearest Neighbor Dengan Feature Selection Menggunakan Backward Elimination Untuk Prediksi Harga Komoditi Kopi Arabika. ILKOM Jurnal Ilmiah. Vol. 9, No. 2, pp. 188-195.
Prasetio, R.T., Seleksi Fitur Dan Optimasi Parameter K-Nn Berbasis Algoritma Genetika Pada Dataset Medis. Jurnal Responsif, Vol. 2 No.2, pp. 213-221.
Putri, L.A.A.R., Seleksi Fitur Dalam Klasifikasi Genre Musik. Jurnal Ilmiah ILMU KOMPUTER Universitas Udayana, Vol. 10, No.1, pp. 19-26.
Manju, N., B S Harish and V Prajwal. Ensemble Feature Selection and Classification of Internet Traffic using XGBoost Classifier. I. J. Computer Network and Information Security, Vol. 11, No. 7, pp 37-44.
Sayg?l?, A., Classification and Diagnostic Prediction of Breast Cancers via Different Classifiers. International Scientific And Vocational Journal, Vol. 2, No.2, pp 48-56.
Karo, I. M. K., Implementasi Metode XGBoost dan Feature Importance untuk Klasifikasi pada Kebakaran Hutan dan Lahan. Journal of Software Engineering, Information and Communication Technology, Vol. 1, No. 1, pp 10-16.
Mahardika, K. W., Yuita A. S. and Achmad A., Optimasi K-Nearest Neighbour Menggunakan Particle Swarm Optimization pada Sistem Pakar untuk Monitoring Pengendalian Hama pada Tanaman Jeruk. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, Vol. 2, No. 9, pp 3333-3344.
Mardiansyah, H. Penanganan Masalah Data Kredit Untuk Kelas Tidakseimbang Menggunakan SmoteXGBoost. Universitas Sumatera Utara. 2019.
Tama, B. A., Lewis N., S.M. Riazul Islam and Kwak K. S. An enhanced anomaly detection in web traffic using a stack of classifier ensemble. Vol. 8, pp 24120–24134.
Xu, J., Yuanjian Z. and Duoqian M., Three-way confusion matrix for classification: A measure driven view. Information sciences, Vol. 507, pp 772-794.
Nasution, D. A., H. H. Khotimah dan N. Chamidah. Perbandingan Normalisasi Data Untuk Klasifikasi Wine Menggunakan Algoritma K-Nn. Cess (Journal of Computer Engineering System and Science), Vol.4, No.1, pp 78-82.
Alkaromi, M. A., Information Gain Untuk Pemilihan Fitur Pada Klasifikasi Heregistrasi Calon Mahasiswa Dengan Menggunakan K-NN. Universitas Dian Nuswantoro. 2014.
Ladha, L. and T. Deepa, Feature Selection Methods and Algorithms. International Journal on Computer Science and Engineering, Vol. 3, No. 5, pp. 1787-1797.
Cai, J., Luo J., Wang S., Yang S., Feature selection in machine learning: a new perspective. Neurocomputing, Vol. 300, pp. 70-79.
Fermansah, D., Penggunaan Metode Traditional Transformations Data Augmentation Untuk Peningkatan Hasil Akurasi Pada Model Algoritma Convolutional Neural Network (CNN) di Klasifikasi Gambar. Universitas Siliwangi. 2019.
Khoiruddin, M., Klasifikasi Penyakit Daun Padi Menggunakan Convolutional Neural Network. Institut Teknologi Telkom Purwokerto. 2021.
Leidiana, H., Penerapan algoritma K-Nearest Neighbor untuk penentuan resiko kredit kepemilikan kendaraan bemotor. PIKSEL: Penelitian Ilmu Komputer Sistem Embedded and Logic, Vol.1, No. 1, pp. 65-76.
Downloads
Published
Issue
Section
License
Semua tulisan pada jurnal ini menjadi tanggungjawab penuh penulis.