Optimasi Algoritma NaÃ¯ve Bayes dengan Information Gain Ratio untuk Menangani Dataset Berdimensi Tinggi

M. Adib Al karomi; Ivandari Ivandari

doi:10.47775/ictech.v14i2.61

Penulis

M. Adib Al karomi STMIK Widya Pratama
Ivandari Ivandari STMIK Widya Pratama

DOI:

https://doi.org/10.47775/ictech.v14i2.61

Abstrak

Perkembangan ilmu komputer sekarang memungkinkan adanya pencatatan semua proses bisnis di segala bidangÂ denganÂ mediaÂ penyimpananÂ yangÂ besar.Â DataÂ diÂ bidangÂ atronomi,Â kesehatan,Â ekonomi, pemerintahanÂ danÂ sebagainyaÂ banyakÂ tercatatÂ danÂ semakinÂ banyakÂ dariÂ tahunÂ keÂ tahun.Â DataÂ mining merupakanÂ ilmuÂ yangÂ dapatÂ mengolahÂ dataÂ menjadiÂ sebuahÂ representasiÂ pengetahuanÂ dengan menggunakan beberapa metode atau algoritma matematis. Salah satu fungsi utama data mining adalah klasifikasi.Â DalamÂ prosesÂ klasifikasiÂ semuaÂ dataÂ lamaÂ digunakanÂ sebagaiÂ dataÂ pembelajaranÂ untuk menyimpulkan data baru yang belum sepenuhnya diketahui. Data yang sebelumnya tidak memiliki makna dapat menjadi sebuah pengetahuan baru dengan menggunakan klasifikasi data mining. Banyak algoritma yangÂ dapatÂ digunakanÂ dalamÂ prosesÂ klasifikasi.Â SalahÂ satuÂ algoritmaÂ yangÂ terbuktiÂ baikÂ untukÂ proses klasifikasi data berdimensi tinggi adalah naÃ¯ve bayes. Dalam data berdimensi tinggi banyaknya atribut data dapat mempengaruhi hasil klasifikasi. Banyaknya atribut data yang relevan dapat meningkatkan performa algoritma.Â SedangkanÂ banyaknyaÂ atributÂ dataÂ yangÂ tidak Â relevanÂ dapatÂ menurunkanÂ tingkatÂ akurasi sebuah algoritma. Dari hasil penelitian ini diketahui bahwa seleksi fitur information gain dapat meningkatkan performa klasifikasi naive bayes.

Referensi

Alkaromi, M Adib. 2014. â€œInformation Gain Untuk Pemilihan Fitur Pada Klasifikasi Heregistrasi Calon Mahasiswa Dengan Menggunakan K-NN.â€

Alpaydin, Ethem. 2010. Introduction to Machine Learning Second Edition. London: The MIT Press.

Amancio, D. R., C. H. Comin, D. Casanova, G. Travieso, O. M. Bruno, F. a. Rodrigues, and L. Da F. Costa. 2013. â€œA Systematic Comparison of Supervised Classifiers,â€ October. http://arxiv.org/abs/1311.0202v1.

Ashari, Ahmad, Iman Paryudi, and A Min Tjoa. 2013. â€œPerformance Comparison between NaÃ¯ve Bayes , Decision Tree and k-Nearest Neighbor in Searching Alternative Design in an Energy Simulation Toolâ€ 4 (11): 33â€“39.

Han, Jiawei, and Micheline Kamber. 2006. Data Mining: Concepts and Techniques Second Edition. Elsevier. Elsevier.

Koprinska, Irena. 2010. â€œFeature Selection for Brain-Computer Interfaces,â€ 100â€“111.

Kurniawan, M. Faisal, and Ivandari. 2017. â€œKomparasi Algoritma Data Mining Untuk Klasifikasi Kanker Payudara.â€ IC Tech I April 20: 1â€“8.

Maimoon, Oded, and Lior Rokach. 2010. Data Mining and Knowledge Discovery Handbook. Vol. 40. Springer. https://doi.org/10.1002/1521-3773(20010316)40:6<9823::AID-ANIE9823>3.3.CO;2-C.

Patel, Kanu, Jay Vala, and Jaymit Pandya. 2014. â€œComparison of Various Classification Algorithms on Iris Datasets Using WEKAâ€ 1 (1): 1â€“7.

Ragab, Abdul Hamid M., Amin Y. Noaman, Abdullah S. Al-Ghamdi, and Ayman I. Madbouly. 2014. â€œA Comparative Analysis of Classification Algorithms for Students College Enrollment Approval Using Data Mining.â€ Proceedings of the 2014 Workshop on Interaction Design in Educational Environments - IDEE â€™14, 106â€“13. https://doi.org/10.1145/2643604.2643631.

Witten, Ian H, Eibe Frank, and Mark A. Hall. 2011. Data Mining: Practical Machine Learning Tools and Techniques 3rd Edition. Elsevier.

Wu, Xindong. 2009. The Top Ten Algorithms in Data Mining. Edited by Vipin Kumar. New York: Taylor & Francis Group, LLC.