Implementasi dan Analisis Algoritma Single Pass Clustering untuk Pengelompokan Dokumen Berita Kejadian Bahasa Indonesia<br>Implementation and Analysis of Single Pass Clustering Algorithm for Indonesian News Event Document Clustering

David Widyarto

Informasi Dasar

113060199
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Dengan semakin berkembanganya teknologi informasi, jumlah dokumen teks berupa digital semakin berkembang dengan pesat. Untuk melakukan pencarian informasi tentang kejadian-kejadian baru yang berkaitan dengan topik tertentu dalam kumpulan dokumen akan lebih sulit. Clustering merupakan salah satu metode data mining yang bersifat unsupervised learning untuk mengelompokkan dokumen berdasarkan kemiripannya. Untuk melakukan pngelompokan tersebut, digunakan salah satu algoritma clustering yaitu single pass clustering. Single pass clustering merupakan suatu tipe clustering yang berusaha melakukan pengelompokan data satu demi satu dan pembentukan kelompok dilakukan seiring dengan pengevaluasian setiap data yang dimasukkan ke dalam proses cluster. Jumlah cluster yang dihasilkan sangat tergantung pada nilai threshold. Kemiripan antar dokumen yang digunakan adalah standard cosine similarity.

Dalam Tugas Akhir ini kualitas cluster yang dihasilkan diukur dengan dua parameter yaitu cohesion dan separation. Nilai threshold 0.03 menghasilkan nilai rata-rata cohesion sebesar 0.13863266 dan rata-rata separation sebesar 0.009379814.Kata Kunci : single pass clustering, unsupervised learning,cosine similarity, threshold, cohesion, separation.ABSTRACT: The growing up of information technology, couse of the number of digital text documents also grow up rapidly. To retrieve of information about current event related to specific topics in a documents collection will be more difficult. Clustering is one of data mining method which is unsupervised learning to classify documents based on similarity. One of clustering method is single pass clustering. Single pass clustering is a type of clustering algorithm that try to create group of data one by one and the formation of the group performed in line with the evaluation of any data entered into the cluster process. The number of clusters generated is depended on the threshold value. The similarity between the documents uses the standard cosine similarity.

In this final project, the quality of the clusters result is measured by two parameters cohesion and separation. Value of 0.03 and 0.029, can produce the average of cohesion 0.13863266 and the average of separation 0.009379814.Keyword: single pass clustering, unsupervised learning, cosine similarity, threshold, cohesion, separation.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Implementasi dan Analisis Algoritma Single Pass Clustering untuk Pengelompokan Dokumen Berita Kejadian Bahasa Indonesia
Implementation and Analysis of Single Pass Clustering Algorithm for Indonesian News Event Document Clustering
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

David Widyarto
Perorangan
Imelda Atastina, Angelina Prima Kurniati
 

Penerbit

Universitas Telkom
Bandung
2011

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini