Analisis Dan Implementasi Data Clustering Dengan Menggunakan Algoritma Incremental Genetik K-Means

Tyas Ayu Landiastuti

Informasi Dasar

113070271
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Data merupakan sumber penting yang dapat diolah menjadi suatu informasi yang berguna.Untuk menghasilkan informasi yang berguna data harus diolah dengan baik.Data mining merupakan proses mengolah data menjadi suatu informasi. Dalam data mining terdapat berbagai macam teknik untuk mengolah data, salah satunya adalah clustering.Clustering merupakan proses pengelompokan data berdasarkan kesamaan karakteristik yang dimiliki data, sehingga dihasilkan beberapa cluster dengan karakteristik yang berbeda. Untuk mengukur kesamaan antardata dapat digunakan pengukuran jarak untuk data bertipe numerik, misalnya Euclidean distance.Euclidean distanceakan sangat mudah digunakan dan berkeja sangat baik ketika data bertipe numerik, tetapi tidak dapat digunakan ketika data bertipe categori atau campuran. Di dunia nyata banyak data yang betipe kategori maupun campuran.Pada Tugas Akhir ini akan dilakukan clustering data bertipe campuran dengan menggunakn Incremental Genetic K-means Algorithm (IGKA).
Pada Tugas Akhir ini perhitungan jarak akan dilakukan secara terpisah untuk data numerik dan kategori. Algoritma Incremental Genetic K-means dimulai dengan inisialisasi individu sejumlah populasi P secara random, lalu dilakukan perhitungan fitness dan seleksi, kemudian individu yang terseleksi akan dimutasi. Setelah tahap mutasi selesai, maka semua individu masuk ke tahap k-means. Proses ini akan terus berjalan sampai akhir iterasi atau jika pusat sudah tidak berubah. Dari hasil pengujian dan analisa didapatkan bahwa jumlah klaster dapat mempengaruhi silhouette coefficient. Semakin besar jumlah klaster maka silhouette coefficient akan semakin besar.Kata Kunci : data mining, Clustering, IGKA, data bertipe campuranABSTRACT: Data is an important resource that can be processed into an useful information. To generate the data to be an information, the data must be processed properly. Data mining is a process to find an interesting information from very large data. In data mining there are many techniques to process the data, one of which is clustering. Clustering is the process of grouping the data based on characteristics of data into cluster(group) that has a same characteristics (similarity) in the same cluster and has a different characteristics (dissimilarity) with object in the other cluster. To measure the similarity between the data, the distance measurement can be used for numeric data type, such as Euclidean distance. Euclidean distance is very easy to be use and working good when the type of data is numeric, but when the type of data is categorical or mixed, Euclidean distance is cannot be used. In real world, a lot of data is categorical or mixed. In this Final project will be implemented clustering mixed type data with Incremental Genetic K-means Algorithm.
In this Final Project the distance will be calculated separately for numerical and categorical data. Incremental Genetic K-means Algorithm starts with the randomized initialization of population, and calculate the fitness function and selection, then the individual who are selected will be transferred with mutation operator. After the mutation phase all individuals will be processed with k-means operator. This process will continue until the end of iteration or until the center of each cluster has not changed. From result and the analysis found that the number of clusters can affect the silhouette coefficient. The larger number of clusters will make the silhouette coefficient tends to increasingly rise.Keyword: data mining, clustering, IGKA, mixed data type

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis Dan Implementasi Data Clustering Dengan Menggunakan Algoritma Incremental Genetik K-Means
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Tyas Ayu Landiastuti
Perorangan
Arie Ardiyanti Suryani, Intan Nurma Yulita
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini