Clustering Data Kategorik Menggunakan K-modes dengan Weighted Dissimilarity Measure

Lutfi Hidayat Ramdhani

Informasi Dasar

113060058
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: K-Modes merupakan pengembangan dari algoritma clustering K-means untuk menangani data kategorik di mana means diganti oleh modes. K-Modes menggunakan simple matching meassure dalam penentuan similarity dari suatu klaster. Di dalam penelitian ini akan memodifikasi algoritma k-modes dalam penentuan similarity dengan menggunakan weighted dissimilarity meassure karena nilai dari suatu atribut cukup berpengaruh dalam clustering. Pengujian akan menggunakan real world data set yang disediakan oleh UCI repository yang bertipe kategorik. Penilaian performa dilihat dari cluster purity yang dihasilkan. Dari hasil pengujian didapatkan cluster purity pada algoritma k-modes yang menggunakan weighted dissimilarity measure memiliki nilai yang lebih baik dari algoritma k-modes sebelumnya. Ini menunjukkan objek dialokasikan kepada cluster lebih akurat menggunakan algoritma k-modes yang baru.Kata Kunci : clustering, data kategorik, weighted dissimilarity measure, cluster purityABSTRACT: K-Modes is an extension from K-means clustering algorithm for handling categorical data where modes is used instead of means. Simple K-Modes use simple matching measure to decide similarity value from a cluster. This research will modified k-modes algorithm in deciding similarity value using weighted dissimilarity measure because the value from an attribute really affect a clustering process. The experiment will be tested using real world data sets obtained from the UCI data repository where the type of the data sets is categorical. The performance of the algorithm will be seen from the value of cluster purity from created clusters. From the test showed that the value of cluster purity using k-modes algorithm using weighted dissimilarity measure has the better result from the original k-modes. It shows that object is more accurate allocated in their respective cluster using the new improved k-modes.Keyword: clustering, categorical data, weighted dissimilarity measure, cluster purity

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Clustering Data Kategorik Menggunakan K-modes dengan Weighted Dissimilarity Measure
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Lutfi Hidayat Ramdhani
Perorangan
Hetti Hidayati, Mahmud Dwi Suliiyo
 

Penerbit

Universitas Telkom
Bandung
2013

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini