SUBSPACE CLUSTERING PADA DATA MULTIDIMENSI MENGGUNAKAN ALGORITMA MAFIA

I NGH AGUS ELEC A

Informasi Dasar

113040285
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Data mining adalah suatu proses analisis untuk mendapatkan informasi yang penting dan terpendam dari sekumpulan data yang belum diketahui sebelumnya. Clustering merupakan salah satu fungsionalitas data mining yang digunakan untuk melakukan pengelompokan data ke dalam suatu kelas atau cluster. Prinsip dasar clustering adalah mengelompokkan objek pada suatu kelas yang memiliki kemiripan sangat besar dengan objek lain pada kelas yang sama (similarity), tetapi sangat tidak mirip dengan objek pada kelas lain (dissimilarity). Kebanyakan algoritma clustering hanya bisa menangani data yang memiliki dimensi rendah sehingga hasil clustering yang didapat kurang berkualitas. Subspace clustering adalah metode yang dapat digunakan untuk menentukan cluster yang terbentuk pada subspace yang berbeda sehingga lebih baik dalam menangani data multidimensi dibandingkan dengan cara clustering pada umumnya. Algoritma yang menerapkan subspace clustering antara lain: COSA, FINDIT, ENCLUS, CLIQUE, MAFIA, dan lain-lain.
Pada Tugas Akhir ini diimplementasikan algoritma MAFIA (Merging of Adaptive Finite Intervals). MAFIA adalah algoritma clustering yang menerapkan metode subspace clustering dengan mengintegrasikan metode density-based dan adaptive-grid based sehingga algoritma ini cukup baik untuk menangani data multidimensional. MAFIA termasuk density-based methods karena melakukan clustering berdasarkan densitas dalam suatu data yang ada dan menggunakan histogram untuk menganalisis jarak antar data dalam setiap dimensi. Algoritma ini menggunakan pendekatan bottom up search untuk menemukan dense unit berdasarkan dimensi untuk mengurangi ruang pencarian. MAFIA tidak membutuhkan inputan berupa jumlah cluster yang akan dicari dalam proses clustering. Sehingga algoritma ini lebih fleksibel dalam pencarian cluster dari dataset.
Algoritma MAFIA diuji menggunakan data buatan yang di-generate secara online di www.datasetgenerator.com. Hasil uji menunjukkan bahwa algoritma MAFIA baik digunakan untuk clustering data multidimensi. Kualitas ini tercermin dari maksimum akurasi yang ditemukan yaitu sebesar 0.89.Kata Kunci : clustering, MAFIA algorithm, data mining, subspace clustering.ABSTRACT: Data mining is a analize process to get important information wich is contained ing some unknow collected data. Clustering is a kind of data mining’s fungsionality wich is used to do collectivity data into class or cluster. The principle of clustering is gruoping object into a class wich have big same other object in some class (similarity) , but its very difference with object in diffrent class (disimilarity). Almost all of clustering algorithm only can solve data with low dimensinality so that result of clustering have less quality. Aubspace clustering is a method to dicided cluster wich built in different subspace so that prefer handling multidimension data to common clustering. Algorithm that implemention subspace clustering such as: COSA, FINDIT, ENCLUS, PROCLUS, CLIQUE, MAFIA, ect.
This final project is implemented with MAFIA (Merging of adaptive Finite Intervals). MAFIA is clustering algorithm which use subspace clustering methodby integrity density based and adaptive grid based method so that this algorithm is good enough to handle multidimension data. MAFIA is a density based method due to clustering implementasion based on the density of data that use histogram for analyzing data range on each dimension. This algorithm use bottom-up search to find dense unit depend on the dimension to reduce searching space. Bottom-up use same princip with Apriori algorithm to procused assosoation rule. MAFIA is not need the input number of cluster fund in cluastering so that this algorithm is more fleksible on finding cluster from dataset.
Mafia algorithms tested using syntetic dataset. Datasets are generated online at www.datasetgenerator.com. Test results show that MAFIA is good for clustering data multidimensional. Quality is reflected in the maximum accuracy that is equal to that found 0.89.Keyword: clustering, MAFIA algorithm, data mining, subspace clustering.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

SUBSPACE CLUSTERING PADA DATA MULTIDIMENSI MENGGUNAKAN ALGORITMA MAFIA
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

I NGH AGUS ELEC A
Perorangan
Adiwijawa, Angelina Prima Kurniati
 

Penerbit

Universitas Telkom
Bandung
2009

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini