IMPLEMENTASI NAÃVE BAYES CLASSIFIER UNTUK KLASIFIKASI PENCARIAN TEMPAT KOST
DOI:
https://doi.org/10.47775/ictech.v15i1.93Abstrak
Artikel ini membahas penggunaan Naïve Bayes Classifier dengan menggunakan data dari web www.jakarta.craiglist.org. Craiglist menyediakan iklan baris dan forum lokal untuk pekerjaan , perumahan untuk dijual, personal, layanan, komunitas lokal dan acara. Dengan menggunakan aplikasi web-crawling dengan berbasis naïve bayes, akan digunakan untuk mengumpulkan data teks dari bagian penyewaan tempat kost di wilayah Jakarta dan mengklasifikasikan setiap posting ke kota mana termasuk teks pada judul iklan di Craigslist. Dengan menggunakan data yang sama, berupaya untuk menggunakan judul iklan untuk menentukan braket harga yang termasuk di dalamnya. Sebagai pengolah naïve bayes classifier digunakan versi open source yang tersedia di https://github.com/alexandru/stuff-classifier untuk melakukan klasifikasi. Membandingkan naïve bayes dengan statistik Tf-Idf. Berdasarkan hasil pengolahan menunjukkan bahwa judul saja bukan indikator yang baik tentang berapa kisaran harga suatu iklan. Selain itu, naïve bayes melakukan sedikit lebih baik dibandingkan metode Tf-Idf yang hanya berdasarkan pada kebenaran klasifikasi. Untuk mendapatkan hasil yang lebih baik, dilakukan penyujian web crawler lebih lanjut dan memasukkan deskripsi tekstual yang lebih panjang dari setiap daftar ke dalam proses klasifikasi. Dengan melakukan hal tersebut ternyata tidak menghasilkan perubahan perilaku output dari salah satu classifier.
Kata Kunci: naïve bayes, klasifikasi, web crawler
Referensi
Artaye, Ketut (2015). Implementation of Naïve Bayes Classification method to Predict graduation time of IBI Darmajaya Scholar.
Felida, Naifiri Novitasari (2017). Prediksi waktu Produksi Mebel menggunakan Metode Naïve Bayes.
Feldman, Ronen, dan Sanger, James. (2007). The Text Mining Handbook Advanced Approaches in Analyzing Unstructured Data. New York:Cambridge University Press.
Kusrini, & Luthfi, E. T. (2009). Algoritma Data Mining. Yogyakarta: C.V Andi Offset.
Melita, Ria, Victor Amrizal, Hendra Bayu, Taslimun Dirjam, (2018), Penerapan Metode Term Frequency Inverse Document Frequency (Tf-Idf) Dan Cosine Similarity Pada Sistem Temu Kembali Informasi Untuk Mengetahui Syarah Hadits Berbasis Web (Studi Kasus: Syarah Umdatil Ahkam), JURNAL TEKNIK INFORMATIKA VOL 11 NO. 2, OKTOBER 2018
Nurjoko (2016). Aplikasi Data Mining Untuk Memprediksi Tingkat Kelulusan Mahasiswa Menggunakan Algoritma Apriori Di IBI Darmajaya.
Prasetyo, Eko (2014). Data Mining Mengolah Data Menjadi Informasi Menggunakan Matlab.