Implementasi Klasterisasi Menggunakan Algoritma X Means

R. Dela Arundina

Implementasi Klasterisasi Menggunakan Algoritma X Means

R. Dela Arundina

Informasi Dasar

Implementasi Klasterisasi Menggunakan Algoritma X Means

Dilihat

666 kali

No. Katalog

113051005

Klasifikasi

005.1

Jenis katalog

Karya Ilmiah - Skripsi (S1) - Reference

Abstraksi

ABSTRAKSI: Clustering adalah metode data mining yang mengelompokkan data menjadi kelompokkelompok yang saling terpisah berdasarkan keunikan karakteristiknya. Salah satu algoritma untuk klasterisasi adalah k-means. K-means dinilai sebagai algoritma yang handal dengan waktu eksekusi yang cukup cepat ketika melakukan clustering. Namun, k-means masih memiliki beberapa kekurangan yaitu masalah penentuan jumlah cluster yang masih dilakukan dengan input dari user dan inisialisasi centroid atau pusat cluster.
Kekurangan K-means ini dijawab oleh penemuan algoritma X-means oleh Dan Pelleg dan Andrew Moore. Algoritma ini kemudian akan menambah jumlah cluster secara rekursif hingga jumlahnya sama dengan nilai atas range yang dimasukkan user (upper bound). Hasil akhir dari x-means adalah kelompok-kelompok (cluster) data, dan jumlah cluster terbaik berdasarkan perhitungan uji model yang dilakukan ketika proses eksekusi berlangsung.
Tugas akhir ini bermaksud mengimplementasikan algoritma x-means untuk melakukan clustering pada data. Kemudian, menghitung keakuratan hasil cluster dengan metode silhoutte coefficient. Terakhir, melakukan analisis hasil cluster hingga dicapai kesimpulan yang menjadi tujuan tugas akhir ini.
Kata Kunci : Clustering, K-means, centroid, X-means, range cluster, Silhouette CoefficientABSTRACT: Clustering is one of data mining task. Clustering is grouping data by its characteristic into groups which commonly called clusters. The simplest algorithm for clustering is k-means. Eventhough k-means is considered a reliable and effective clustering algorithm, it still suffer several flaws. Those flaws are the input of number of clusters is still entered by user; and initialization of centroids still using random initialization.
These flaws on K-means are answered by Dan Pelleg and Andrew Moore, founders of Xmeans algorithm. X-means will recursively add the number of clusters until the existing number of clusters are same as the upper bound that entered by user. X-means final results are groups (clusters) of data; the best number of cluster based on the calculation when the program start.
This final task’s intention is to implement X-means algorithm. Then, I calculate the accuracy of clusters using silhouette coefficient method. Finally, I analyze the result until there are conclusions that can be reached.
Keyword: Clustering, K-means, centroid, X-means, cluster range, Silhouette Coefficient