Peningkatan Akurasi Algoritma KNN dengan Seleksi Fitur Gain Ratio untuk Klasifikasi Penyakit Diabetes Mellitus
DOI:
https://doi.org/10.47775/ictech.v12i2.3Abstrak
Diabetes Mellitus merupakan salah satu penyakit kronis yang mematikan. Penyakit yang juga dikenal dengan nama penyakit kencing manis ini terjadi akibat kadar glukosa di dalam darah terlalu tinggi. Diabetes Mellitus banyak diteliti di banyak negara pada saat ini karena peningkatan penderita yang banyak dan sangat mengkhawatirkan. Menurut WHO saat ini lebih dari 246 juta jiwa menderita diabetes dan diperkirakan akan meningkat menjadi 380 juta jiwa pada tahun 2025 apabila tidak dilakukan penanganan yang serius. Dibetes menyebabkan penyakit lain / komplikasi yang setiap tahunya mengakibatkan kematian hingga 3,8 juta jiwa. Data mining merupakan kegiatan menemukan sebuah pola, aturan dan pengetahuan baru dari sebuah dataset. Salah satu fungsi mayor data mining adalah klasifikasi. KNN merupakan salah satu algoritma klasifikasi data mining terbaik dan banyak digunakan. Algoritma KNN bekerja dengan cara menghitung kedekatan data testing dengan keseluruhan data training. K dalam KNN merupakan variabel jumlah tetangga terdekat yang akan diambil untuk proses klasifikasi. Jumlah K=1 akan membuat hasil klasifikasi terasa kalu karena hanya memperhitungkan satu tetangga terdekat atau satu record karakteristik data terdekat. Sedangkan jumlah K yang terlalu banyak akan menghasilkan klaasifikasi yang samar. Dari hasil penelitian yang telah dilakukan disimpulkan bahwa penggunaan algoritma seleksi fitur gain ratio dapat meningkatkan akurasi dari klasifikasi penyakit diabetus mellitus dengan menggunakan algoritma knn. Adapun kenaikan akurasi tertinggi didapatkan pada nilai treshold 0,152 dengan hanya mempertahankan 4 atribut dari keseluruhan 8 atribut data
Referensi
Alkaromi, M Adib. 2014. “Information Gain Untuk Pemilihan Fitur Pada Klasifikasi Heregistrasi Calon Mahasiswa Dengan Menggunakan K-NN.”
Ashari, Ahmad, Iman Paryudi, and A Min Tjoa. 2013. “Performance Comparison between Naïve Bayes , Decision Tree and K-Nearest Neighbor in Searching Alternative Design in an Energy Simulation Tool” 4 (11): 33–39.
Azhagusundari, B, and Antony Selvadoss Thanamani. 2013. “Feature Selection Based on Information Gain,” no. 2: 18–21.
Barakat, Nahla H, Andrew P Bradley, Senior Member, and Mohamed Nabil H Barakat. 2010. “Intelligible Support Vector Machines for Diagnosis of Diabetes Mellitus.” IEEE Transaction on Information Technology in Biomedicine 14 (4): 1114–20.
Christobel, Angeline, and D.r Sivaprakasam. 2011. “An Empirical Comparison of Data Mining Classification Methods” 3 (2): 24–28.
Gorunescu, Florin. 2011. Data Mining: Concept, Models and Techniques. Vol 12. Berlin: Heidelberg: Springer Berlin Heidelberg.
Han, Jiawei, and Micheline Kamber. 2006. Data Mining: Concepts and Techniques Second Edition. Elsevier. Elsevier.
Indrayanti, Devi Sugianti, and M Adib Al Karomi. 2017. “Optimasi Parameter K Pada Algoritma K-Nearest Neighbour Untuk Klasifikasi Penyakit Diabetes Mellitus.” Prosiding SNATIF Buku 3 (2017): 823–29.
Karomi, M Adib Al. 2015. “Optimasi Parameter K Pada Algoritma KNN Untuk Klasifikasi Heregistrasi Mahasiswa Program Studi Teknik Informatika STMIK Widya Pratama Jl . Patriot 25 Pekalongan Email?: Adib.comp@gmail.com.” IC-TECH X (285): 5.
Larose, Daniel T. 2005. Discovering Knowledge in Data: An Introduction to Data Mining. John Wiley & Sons.
Maulana, Much. Rifqi, and M Adib Al Karomi. 2015. “Jurnal Litbang, 10.” Jurnal Litbang Kota Pekalongan 9 (1): 113–23.
Prasetyo, Eko. 2012. Data Mining Konsep Dan Aplikasi Menggunakan Matlab. Yogyakarta: Andi Offset.
Ragab, Abdul Hamid M., Amin Y. Noaman, Abdullah S. Al-Ghamdi, and Ayman I. Madbouly. 2014. “A Comparative Analysis of Classification Algorithms for Students College Enrollment Approval Using Data Mining.” Proceedings of the 2014 Workshop on Interaction Design in Educational Environments - IDEE ’14. New York, New York, USA: ACM Press, 106– 13. doi:10.1145/2643604.2643631.
Report of a WHO / IDF Consultation. 2006. “Definition and Diagnosis of Diabetes Mellitus and Intermediate Hyperglycemia.” WHO Library Cataloguing-in-Publication Data. 1211 Geneva 27, Switzerland.
Santosa, Budi. 2007. Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis. Edisi Pert. Yogyakarta: Graha Ilmu.
Susanto, Sani, and Dedi Suryadi. 2010. Pengantar Data Mining: Menggali Pengetahuan Dari Bongkahan Data. Yogyakarta: Andi Offset.
Temurtas, Hasan, Nejat Yumusak, and Feyzullah Temurtas. 2009. “A Comparative Study on Diabetes Disease Diagnosis Using Neural Networks.” Expert Systems with Applications 36 (4). Elsevier Ltd: 8610–15. doi:10.1016/j.eswa.2008.10.032.
Witten, Ian H, Eibe Frank, and Mark A. Hall. 2011. Data Mining: Practical Machine Learning Tools and Techniques 3rd Edition. Elsevier.
Wu, Xindong, Vipin Kumar, J. Ross Quinlan, Joydeep Ghosh, Qiang Yang, Hiroshi Motoda, Geoffrey J. McLachlan, et al. 2007. Top 10 Algorithms in Data Mining. Knowledge and Information Systems. Vol. 14. doi:10.1007/s10115-007-0114-2.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2018 IC-Tech
Artikel ini berlisensi Creative Commons Attribution 4.0 International License.