Penerapan Metode Sample Bootstrapping untuk Meningkatkan Performa kNearest Neighbor pada Dataset Berdimensi Tinggi
DOI:
https://doi.org/10.47775/ictech.v12i1.13Abstrak
Dalam klasifikasi semakin banyak atribut yang relevan yang dipakai akan mempengaruhi hasil akurasi dari algoritma tersebut. Seleksi fitur merupakan salah satu tahapan pre processing klasifikasi dengan cara menghilangkan fitur yang tidak relevan dalam data. Proses ini juga dapat mengurangi dimensi data serta meningkatkan akurasi klasifikasi. Algoritma kNearest Neighbor (kNN) merupakan metode untuk melakukan klasifikasi terhadap objek baru berdasarkan k tetangga terdekatnya. Algoritma kNN memiliki kelebihan karena sederhana, efektif dan telah banyak digunakan pada banyak masalah klasifikasi. Pada penelitian ini penggunaan metode Sample Bootstrapping diusulkan untuk meningkatkan akurasi yang optimal pada algoritma kNN. Metode Sample Bootstrapping digunakan untuk mengurangi jumlah data training yang akan diproses. Dalam penelitian ini menggunakan dataset yang memiliki dataset dengan dimensi yang tinggi. Dari hasil penelitian, penggunaan Sample Bootstrapping dengan algoritma pada dataset credit approval akurasinya meningkat 5.4% (96.87%-91.52%) dibandingkan algoritma kNN standar. Dari hasil penelitian yang dilakukan, dapat disimpulkan bahwa penggunaan Sample Bootstrapping dengan algoritma kNN menghasilkan akurasi yang lebih baik daripada algoritma kNN standar.