Analisis Metode Klasifikasi Naïve Bayes Pada Apache Spark

WINDI OKTABERI PRATAMA

Informasi Dasar

17.04.3639
C
Karya Ilmiah - Skripsi (S1) - Reference

Big data menjadi kata yang popular seiring dengan bagaimana dapat menyimpan data dalam jumlah yang besar, melakukan proses serta analisanya. Data explotion problem menjadi bagian penting dalam big data, dimana data dengan jumlah besar tidak dapat diolah secara cepat guna memberikan suatu informasi (Knowladge). Pemrosesan big data diperlukan data mining untuk mengolah agar dapat dimanfaatkan salah satunya salam pencarian informasi. Pada data mining, data dapat diproses salah satunya menggunakan metode klasifikasi dengan naïve bayes, yaitu suatu metode klasifikasi yang dilakukan berdasarkan probabilitas dari setiap class variable inputan. Proses perhitungan klasifikasi naïve bayes ini akan menggunkan sistem parallel computing dalam melakukan pengolahan data dalam jumlah besar (big data) dengan konsep Resilient Distributed Dataset (RDD). Hasil perhitungan menggunakan konsep Resilient Distributed Dataset membuktikan perhitungan dapat dilakukan secara lebih cepat dibandingkan dengan pengolahan data mining menggunakan weka dan dengan akurasi yang lebih baik. Hasil percobaan menunjukkan persentasi akurasi, recall dan precision terbaik pada kasus dataset poker hand testing terletak pada percentage rasio 60:40 dengan waktu eksekusi 10,209 detik yang dijalankan pada 3 worker dengan spesifikasi hardware yang sejenis.

Kata kunci : Data Mining, Big Data, Naïve Bayes, Resilient Distributed Dataset

Subjek

BIG DATA
 

Katalog

Analisis Metode Klasifikasi Naïve Bayes Pada Apache Spark
 
 
INDONESIA

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

WINDI OKTABERI PRATAMA
Perorangan
IBNU ASROR, RIZKI
 

Penerbit

Universitas Telkom
BANDUNG
2017

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini