Informasi Umum

Kode

113080090

Klasifikasi

005.1 - Computer programming

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Informatika Teori Dan Pemrograman

Dilihat

552 kali

Informasi Lainnya

Abstraksi

ABSTRAKSI: Berita saat ini tidak hanya disebarkan melalui media elektronik dan media cetak, namun juga disebarkan melalui dunia internet. Sehingga jumlah berita yang tersedia sangatlah besar dan butuh waktu lama untuk mengelompokkannya secara manual. Clustering dapat digunakan sebagai solusi dari permasalahan tersebut. Salah satu metode yang dapat digunakan untuk clustering dokumen berita ini adalah metode Hierarchical Agglomerative Clustering (HAC). Pada tugas akhir ini metode HAC yang digunakan ialah Single Link, Complete Link, dan Average Link.<br><br>Metode HAC mempunyai kemampuan menggabungkan data dengan membuat hirarki, dimana data yang memiliki kemiripan akan ditempatkan di hirarki yang berdekatan dan yang tidak memiliki kemiripan ditempatkan pada hirarki yang berjauhan. Setiap dokumen akan dianggap sebagai sebuah cluster, kemudian digabungkan sesuai dengan metode HAC yang digunakan, berulang hingga jumlah cluster sesuai dengan yang diinginkan.<br><br>Hirarki yang terbentuk akan dihitung kualitasnya menggunakan cophenetic correlation coefficient, sementara kualitas cluster yang terbentuk akan dihitung menggunakan silhouette coefficient dan purity.Kata Kunci : Clustering, HAC, cophenetic correlation coefficient, silhouette coefficient,ABSTRACT: News today is not only disseminated through electronic media and print media, but also disseminated through the internet. So the amount of news available is enormous and it took a long time to group them manually. Clustering can be used as a solution to these problems. One method that can be used for word document clustering is a method Hierarchical Agglomerartive Clustering (HAC). In this final project HAC method used is Single link, Complete link, and Average link.<br><br>HAC method has the ability to combine data to create hierarchies, which have similar data will be placed in an adjacent hierarchy and that it bears no resemblance to the hierarchy that placed far apart. Each document will be considered as a cluster, then combined according to the HAC method used, repeated until the number of clusters as desired.<br><br>Hierarchy that is formed will be calculated using the cophenetic correlation coefficient of quality, while the quality of the formed clusters will be calculated using silhouette coefficient and purity.Keyword: clustering, cophenetic correlation coefficient, silhouette coefficient, purity

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama Donny Iswan Situngkir
Jenis Perorangan
Penyunting Ema Rachmawati, Warih Maharani
Penerjemah

Penerbit

Nama Universitas Telkom
Kota Bandung
Tahun 2013

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi