Implementasi Klasterisasi Menggunakan Algoritma X Means

R. Dela Arundina

Informasi Dasar

113051005
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Clustering adalah metode data mining yang mengelompokkan data menjadi kelompokkelompok yang saling terpisah berdasarkan keunikan karakteristiknya. Salah satu algoritma untuk klasterisasi adalah k-means. K-means dinilai sebagai algoritma yang handal dengan waktu eksekusi yang cukup cepat ketika melakukan clustering. Namun, k-means masih memiliki beberapa kekurangan yaitu masalah penentuan jumlah cluster yang masih dilakukan dengan input dari user dan inisialisasi centroid atau pusat cluster.
Kekurangan K-means ini dijawab oleh penemuan algoritma X-means oleh Dan Pelleg dan Andrew Moore. Algoritma ini kemudian akan menambah jumlah cluster secara rekursif hingga jumlahnya sama dengan nilai atas range yang dimasukkan user (upper bound). Hasil akhir dari x-means adalah kelompok-kelompok (cluster) data, dan jumlah cluster terbaik berdasarkan perhitungan uji model yang dilakukan ketika proses eksekusi berlangsung.
Tugas akhir ini bermaksud mengimplementasikan algoritma x-means untuk melakukan clustering pada data. Kemudian, menghitung keakuratan hasil cluster dengan metode silhoutte coefficient. Terakhir, melakukan analisis hasil cluster hingga dicapai kesimpulan yang menjadi tujuan tugas akhir ini.
Kata Kunci : Clustering, K-means, centroid, X-means, range cluster, Silhouette CoefficientABSTRACT: Clustering is one of data mining task. Clustering is grouping data by its characteristic into groups which commonly called clusters. The simplest algorithm for clustering is k-means. Eventhough k-means is considered a reliable and effective clustering algorithm, it still suffer several flaws. Those flaws are the input of number of clusters is still entered by user; and initialization of centroids still using random initialization.
These flaws on K-means are answered by Dan Pelleg and Andrew Moore, founders of Xmeans algorithm. X-means will recursively add the number of clusters until the existing number of clusters are same as the upper bound that entered by user. X-means final results are groups (clusters) of data; the best number of cluster based on the calculation when the program start.
This final task’s intention is to implement X-means algorithm. Then, I calculate the accuracy of clusters using silhouette coefficient method. Finally, I analyze the result until there are conclusions that can be reached.
Keyword: Clustering, K-means, centroid, X-means, cluster range, Silhouette Coefficient

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Implementasi Klasterisasi Menggunakan Algoritma X Means
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

R. Dela Arundina
Perorangan
Shaufiah, Toto Suharto
 

Penerbit

Universitas Telkom
Bandung
2010

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini