Analisis Metode K-Means Clustering Pada Apache Spark

ARIEF FRIZZA WARDHANA

Informasi Dasar

197 kali
17.04.3601
C
Karya Ilmiah - Skripsi (S1) - Reference

Big data menjadi populer bagi penikmat ilmu komputer di seluruh dunia. Begitu banyaknya data dengan jumlah yang besar dan bervariatif akan begitu sulit dalam melakukan analisis data. Dalam pemrosesan big data mining tentu akan berbeda dengan data mining. Big data mining dengan jumlah data sangat besar harus dilakukan secepat mungkin dengan dipecah ke beberapa node (Parallel computing) untuk mendapatkan informasi yang bermanfaat. Untuk itu akan dilakukan analisis untuk mengetahui pemrosesan big data mining. Analisis dilakukan melalui simulasi dengan konfigurasi multi-node yang dimana terdiri dari beberapa komputer yang sudah dikonfigurasi. Big data mining pada tugas akhir ini akan menggunakan metode clustering. Pada metode clustering ini algoritma yang digunakan adalah K-means. Hasil dari k means clustering big data mendapatkan cluster optimal yaitu K = 5 dan waktu pemrosessan bergantung pada cluster mode, jumlah worker dan spesifikasi hardware yang digunakan, jika hardware dengan spesifikasi rendah digunakan pada saat cluster mode otomatis kemampuan untuk pemrosesan mengikuti hardware spesifikasi rendah tersebut.

Kata Kunci : Big Data, Data Mining, Clustering, K-Means, Cluster Mode

Subjek

BIG DATA
 

Katalog

Analisis Metode K-Means Clustering Pada Apache Spark
 
 
INDONESIA

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

ARIEF FRIZZA WARDHANA
Perorangan
IBNU ASROR, RIZKI
 

Penerbit

Universitas Telkom
BANDUNG
2017

Koleksi

Kompetensi

  • CS4333 - DATA MINING
  • CSG3L3 - SISTEM TERDISTRIBUSI
  • CCH4D4 - TUGAS AKHIR
  • CSH3J3 - SISTEM PARALEL DAN TERDISTRIBUSI
  • CII3D4 - SISTEM PARALEL DAN TERDISTRIBUSI
  • CII4E4 - TUGAS AKHIR
  • CPI3D4 - SISTEM PARALEL DAN TERDISTRIBUSI
  • III4A4 - TUGAS AKHIR

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini