Informasi Umum

Kode

113070271

Klasifikasi

005.1 - Computer programming

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Rekayasa Perangkat Lunak

Dilihat

15 kali

Informasi Lainnya

Abstraksi

ABSTRAKSI: Data merupakan sumber penting yang dapat diolah menjadi suatu informasi yang berguna.Untuk menghasilkan informasi yang berguna data harus diolah dengan baik.Data mining merupakan proses mengolah data menjadi suatu informasi. Dalam data mining terdapat berbagai macam teknik untuk mengolah data, salah satunya adalah clustering.Clustering merupakan proses pengelompokan data berdasarkan kesamaan karakteristik yang dimiliki data, sehingga dihasilkan beberapa cluster dengan karakteristik yang berbeda. Untuk mengukur kesamaan antardata dapat digunakan pengukuran jarak untuk data bertipe numerik, misalnya Euclidean distance.Euclidean distanceakan sangat mudah digunakan dan berkeja sangat baik ketika data bertipe numerik, tetapi tidak dapat digunakan ketika data bertipe categori atau campuran. Di dunia nyata banyak data yang betipe kategori maupun campuran.Pada Tugas Akhir ini akan dilakukan clustering data bertipe campuran dengan menggunakn Incremental Genetic K-means Algorithm (IGKA).<br>Pada Tugas Akhir ini perhitungan jarak akan dilakukan secara terpisah untuk data numerik dan kategori. Algoritma Incremental Genetic K-means dimulai dengan inisialisasi individu sejumlah populasi P secara random, lalu dilakukan perhitungan fitness dan seleksi, kemudian individu yang terseleksi akan dimutasi. Setelah tahap mutasi selesai, maka semua individu masuk ke tahap k-means. Proses ini akan terus berjalan sampai akhir iterasi atau jika pusat sudah tidak berubah. Dari hasil pengujian dan analisa didapatkan bahwa jumlah klaster dapat mempengaruhi silhouette coefficient. Semakin besar jumlah klaster maka silhouette coefficient akan semakin besar.Kata Kunci : data mining, Clustering, IGKA, data bertipe campuranABSTRACT: Data is an important resource that can be processed into an useful information. To generate the data to be an information, the data must be processed properly. Data mining is a process to find an interesting information from very large data. In data mining there are many techniques to process the data, one of which is clustering. Clustering is the process of grouping the data based on characteristics of data into cluster(group) that has a same characteristics (similarity) in the same cluster and has a different characteristics (dissimilarity) with object in the other cluster. To measure the similarity between the data, the distance measurement can be used for numeric data type, such as Euclidean distance. Euclidean distance is very easy to be use and working good when the type of data is numeric, but when the type of data is categorical or mixed, Euclidean distance is cannot be used. In real world, a lot of data is categorical or mixed. In this Final project will be implemented clustering mixed type data with Incremental Genetic K-means Algorithm.<br>In this Final Project the distance will be calculated separately for numerical and categorical data. Incremental Genetic K-means Algorithm starts with the randomized initialization of population, and calculate the fitness function and selection, then the individual who are selected will be transferred with mutation operator. After the mutation phase all individuals will be processed with k-means operator. This process will continue until the end of iteration or until the center of each cluster has not changed. From result and the analysis found that the number of clusters can affect the silhouette coefficient. The larger number of clusters will make the silhouette coefficient tends to increasingly rise.Keyword: data mining, clustering, IGKA, mixed data type

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama Tyas Ayu Landiastuti
Jenis Perorangan
Penyunting Arie Ardiyanti Suryani, Intan Nurma Yulita
Penerjemah

Penerbit

Nama Universitas Telkom
Kota Bandung
Tahun 2012

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi