ABSTRAKSI: Setiap lembaga mempunyai satu atau lebih jenis data yang berkaitan dengan lembaga yang bersangkutan. Salah satu jenis data yang sering ditemukan yaitu data dua dimensi dalam bentuk teks yang mempunyai struktur baris dan kolom untuk mendeskripsikan suatu bagian atau elemen data. Salah satu jenis pengolahan data yaitu pengelompokan data.
Similarity-Driven Cluster Merging merupakan salah satu metode pengelompokan data yang mengedepankan kemiripan antar data dalam membentuk suatu kelompok data atau cluster. Metode Similarity-Driven Cluster Merging dapat diterapkan untuk menentukan cluster suatu jenis data baik pada data yang sudah terklasifikasi maupun pada data yang belum terklasifikasi.
Dalam tugas akhir ini, metode Similarity-Driven Cluster Merging digunakan pada jenis data yang belum mempunyai struktur klasifikasi (unsupervised). Matrik similarity digunakan untuk menghitung dan menampung nilai-nilai kemiripan antar cluster, sehingga dapat ditentukan batasan nilai atau threshold cluster merging sebagai patokan untuk menentukan mirip tidaknya data-data. Generalized Objective Function untuk meng-update nilai keanggotaan data terhadap suatu cluster.
Berdasarkan hasil pengujian dan analisis hasil, metode Similarity-Driven Cluster Merging menghasilkan jumlah cluster dengan kualitas cluster yang paling baik yaitu pada nilai error epsilon 50 dan threshold cluster merging 1.2. Kualitas cluster yang baik ini ditunjukan dengan nilai score function yang mendekati 1.0 yaitu 0.914686.
Kata Kunci : Similarity-Driven Cluster Merging, cluster, threshold cluster merging, error epsilon.ABSTRACT: Each institution likes government institution, education institution, non-government institution, and other must be have at least one data for their business. One of them is two dimensional data. It is textual data. Two dimensional data have two basic structure, that is row and column. That data must to process to result a information. One of the data processing is data classification.
Similarity-Driven Cluster Merging is one of data classification method which mayor in similarity between many data in data population or cluster. Similarity-Driven Cluster Merging method can be use for calculate cluster in the data whenever in classified data or non classified data.
In this thesis, Similarity-Driven Cluster Merging method is used for data that haven’t classification structure(unsupervised).similarity matrix is used for calculating and saving similarity values in cluster, there for we can determine the similarity of data. Beside of them, it also used for Generalized Objective Function to update the membership value data for a cluster.
From the result testing and result analysis, Similarity-Driven Cluster Merging method resulting high quality cluster with error epsilon at 50 and threshold cluster merging 1.2. High quality cluster was shown with high score function value at 0.914686.
Keyword: Similarity-Driven Cluster Merging, cluster, merge threshold, Generalized Objective Function.