Analisis dan Implementasi Hierarchical Agglomerative Clustering pada Dokumen Berita Berbahasa Indonesia

Donny Iswan Situngkir

Informasi Dasar

113080090
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Berita saat ini tidak hanya disebarkan melalui media elektronik dan media cetak, namun juga disebarkan melalui dunia internet. Sehingga jumlah berita yang tersedia sangatlah besar dan butuh waktu lama untuk mengelompokkannya secara manual. Clustering dapat digunakan sebagai solusi dari permasalahan tersebut. Salah satu metode yang dapat digunakan untuk clustering dokumen berita ini adalah metode Hierarchical Agglomerative Clustering (HAC). Pada tugas akhir ini metode HAC yang digunakan ialah Single Link, Complete Link, dan Average Link.

Metode HAC mempunyai kemampuan menggabungkan data dengan membuat hirarki, dimana data yang memiliki kemiripan akan ditempatkan di hirarki yang berdekatan dan yang tidak memiliki kemiripan ditempatkan pada hirarki yang berjauhan. Setiap dokumen akan dianggap sebagai sebuah cluster, kemudian digabungkan sesuai dengan metode HAC yang digunakan, berulang hingga jumlah cluster sesuai dengan yang diinginkan.

Hirarki yang terbentuk akan dihitung kualitasnya menggunakan cophenetic correlation coefficient, sementara kualitas cluster yang terbentuk akan dihitung menggunakan silhouette coefficient dan purity.Kata Kunci : Clustering, HAC, cophenetic correlation coefficient, silhouette coefficient,ABSTRACT: News today is not only disseminated through electronic media and print media, but also disseminated through the internet. So the amount of news available is enormous and it took a long time to group them manually. Clustering can be used as a solution to these problems. One method that can be used for word document clustering is a method Hierarchical Agglomerartive Clustering (HAC). In this final project HAC method used is Single link, Complete link, and Average link.

HAC method has the ability to combine data to create hierarchies, which have similar data will be placed in an adjacent hierarchy and that it bears no resemblance to the hierarchy that placed far apart. Each document will be considered as a cluster, then combined according to the HAC method used, repeated until the number of clusters as desired.

Hierarchy that is formed will be calculated using the cophenetic correlation coefficient of quality, while the quality of the formed clusters will be calculated using silhouette coefficient and purity.Keyword: clustering, cophenetic correlation coefficient, silhouette coefficient, purity

Subjek

Informatika Teori dan Pemrograman
 

Katalog

Analisis dan Implementasi Hierarchical Agglomerative Clustering pada Dokumen Berita Berbahasa Indonesia
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Donny Iswan Situngkir
Perorangan
Ema Rachmawati, Warih Maharani
 

Penerbit

Universitas Telkom
Bandung
2013

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini