ABSTRAKSI: Dengan semakin berkembangnya teknologi, maka kemampuan manusia pun semakin berkembang dalam mengumpulkan dan mengolah data secara terkomputerisasi yang mengakibatkan semakin banyak data yang berbentuk digital. Data yang tersimpan pasti memiliki informasi yang beraneka ragam. Untuk memudahkan pengambilan informasi dari data tersebut diperlukan adanya pengelompokan data secara otomatis. Clustering adalah proses untuk mengelompokkan data ke dalam suatu klaster, sehingga objek pada suatu klaster memiliki kemiripan yang sangat besar dengan objek lain pada klaster yang sama, tetapi sangat tidak mirip dengan objek pada klaster yang lain. Untuk melakukan pengelompokan tersebut, digunakan salah satu algoritma clustering yaitu Jarvis-Patrick clustering. Jarvis-Patrick clustering merupakan metode clustering berdasarkan kesamaan antara tetangga terdekat. Satu atau lebih tetangga pada umumnya adalah digunakan untuk menilai anggota cluster dari objek yang diteliti. Cluster yang terbentuk tergantung dari nilai parameter J dan K. Untuk mengukur similarity antar dokumen sebelum proses clustering digunakan Euclidean distance.
Pada tugas akhir ini kualitas cluster yang dihasilkan diukur menggunakan parameter silhouette coefficient. Berdasarkan percobaan yang dilakukan bahwa rata-rata nilai silhouette coefficient adalah 0.220. Dengan begitu kualitas cluster yang dihasilkan bersifat no structure, maksudnya hampir mustahil menemukan pusat cluster yang signifikan dan jelas menetapkan mayoritas titik data.Kata Kunci : Jarvis Patrick, Euclidean distance, Silhouette Coefficient, ClusteringABSTRACT: With the advancement of technology, the human ability grow even further in collecting and processing data which are computerized and resulted more data in digital form. Data stored must have various informations. For easy retrieval of information from these data is necessary to group data automatically. Clustering is a process for classifying data into clusters, so that an object in a cluster have high similarity with other objects in the same cluster, but is not similar with objects in other clusters. To perform the clustering process, one of the clustering algorithm used is Jarvis Patrick clustering. Jarvis Patrick clustering is a clustering method based on the similarity between the nearest neighbors. One or more neighbors usually are used to calculate the cluster membership of the object being clustered. The cluster formed depending on the value of parameter J and K. To measure the similarity between the documents before the clustering process, Euclidean distance method is used.
In this final project the clusters quality is measured using silhouette coefficient parameters. Based on experiments conducted that average silhouette coefficient value is 0,220. The quality of the cluster is “no structure”, which means becomes practically impossible to find significant cluster centers and to definitely assign the majority of data points.Keyword: Jarvis Patrick, Euclidean distance, Silhouette coefficient, Clustering