Analisis Metode Klasifikasi Naïve Bayes Pada Apache Spark

WINDI OKTABERI PRATAMA

Analisis Metode Klasifikasi Naïve Bayes Pada Apache Spark

WINDI OKTABERI PRATAMA

Informasi Dasar

Analisis Metode Klasifikasi Naïve Bayes Pada Apache Spark

Dilihat

418 kali

No. Katalog

17.04.3639

Klasifikasi

Jenis katalog

Karya Ilmiah - Skripsi (S1) - Reference

Abstraksi

Big data menjadi kata yang popular seiring dengan bagaimana dapat menyimpan data dalam jumlah yang besar, melakukan proses serta analisanya. Data explotion problem menjadi bagian penting dalam big data, dimana data dengan jumlah besar tidak dapat diolah secara cepat guna memberikan suatu informasi (Knowladge). Pemrosesan big data diperlukan data mining untuk mengolah agar dapat dimanfaatkan salah satunya salam pencarian informasi. Pada data mining, data dapat diproses salah satunya menggunakan metode klasifikasi dengan naïve bayes, yaitu suatu metode klasifikasi yang dilakukan berdasarkan probabilitas dari setiap class variable inputan. Proses perhitungan klasifikasi naïve bayes ini akan menggunkan sistem parallel computing dalam melakukan pengolahan data dalam jumlah besar (big data) dengan konsep Resilient Distributed Dataset (RDD). Hasil perhitungan menggunakan konsep Resilient Distributed Dataset membuktikan perhitungan dapat dilakukan secara lebih cepat dibandingkan dengan pengolahan data mining menggunakan weka dan dengan akurasi yang lebih baik. Hasil percobaan menunjukkan persentasi akurasi, recall dan precision terbaik pada kasus dataset poker hand testing terletak pada percentage rasio 60:40 dengan waktu eksekusi 10,209 detik yang dijalankan pada 3 worker dengan spesifikasi hardware yang sejenis.

Kata kunci : Data Mining, Big Data, Naïve Bayes, Resilient Distributed Dataset