ANALISIS TRANSFORMASI DATA DARI EUCLIDEAN DISTANCE MEASURE MENJADI COSINE SIMILARITY MEASURE UNTUK CLUSTERING MENGGUNAKAN ART-2

Fajar Haifani

Informasi Dasar

113060260
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Adaptive Resonance Theory-2 (ART-2) merupakan metode clustering mampu mengatasi masalah stability plasticity dilemma yang menggunakan mengukur proximity secara relatif antar instance berdasarkan sudut. Proximity seperti itu lebih cocok untuk sparse data. Jika Adaptive Resonance Theory-2 digunakan untuk dense data, panjang vektor data akan dinormalisasi sehingga membuat informasi tersebut hilang. Pengukuran proximity untuk dense data lebih baik jika menggunakan proximity yang memenuhi triangle inequality seperti Euclidean distance. Tugas akhir ini menggunakan suatu metode transformasi data sebagai preprocessing yang merepresentasikan Euclidean distance ke dalam cosine similarity measure untuk meningkatkan kualitas hasil clustering dari ART- 2. Clustering dari ART-2 terhadap data yang sudah ditransformasi menunjukkan hasil yang memiliki kualitas cluster yang lebih baik jika dibandingkan dengan hasil clustering dari ART-2 terhadap data yang belum ditransformasi. Rata rata peningkatan yang terjadi adalah 0.087 untuk rand statistic,0.018 untuk jaccard coefficient, 0.205 untuk silhouette coefficient, dan 0.517 untuk davies bouldin.Kata Kunci : ART-2, clustering, euclidean, learning, proximityABSTRACT: Adaptive Resonance Theory-2 (ART-2) is a clustering method which is able to overcome stability plasticity dilemma which measures relative proximity between instances based on angles. That type of proximity is more suitable for sparse data. If ART-2 is used for dense data, every data vector will be normalized so that the information about the length of the vectors disappear. Proximity measure which is suitable for dense data is proximity measure which satisfies triangle inequality like Euclidean distance. This undergraduate thesis proposes a data transformation method which represents Euclidean distance as cosine similarity measure in order to improve the quality of clustering result from ART- 2. Clustering using ART-2 on transformed data shows better quality than on untransformed data. The average improvement is 0.087 for rand statistic, 0.018 for jaccard coefficient, 0.205 for silhouette coefficient, and 0.517 for davies bouldin index.Keyword: ART-2, clustering, euclidean, learning,proximity

Subjek

Rekayasa Perangkat Lunak
 

Katalog

ANALISIS TRANSFORMASI DATA DARI EUCLIDEAN DISTANCE MEASURE MENJADI COSINE SIMILARITY MEASURE UNTUK CLUSTERING MENGGUNAKAN ART-2
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Fajar Haifani
Perorangan
Arief Fatchul Huda., M.Kom., ZK. Abdurahman Baizal
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini