PENGELOMPOKKAN ARTIKEL BERITA DENGAN MENGGUNAKAN METODE WARD'S HIERARCHICAL CLUSTERING

NITA MARTA ASIH

Informasi Dasar

126 kali
113050172
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Pesatnya pertambahan dan keanekaragaman informasi contohnya artikel berita, konsumen berita semakin sulit mencari informasi yang diinginkan. Untuk itu diperlukan pengelompokkan artikel berita dengan menerapkan salah satu teknik yang terkait dengan Data Mining, yaitu “clustering”.
Metode clustering yang digunakan adalah Ward’s method, metode pengelompokkan objek yang menerapkan prinsip agglomerative hierarchical clustering yang bersifat bottom up dimana pengelompokkan dibentuk hirarki dimulai dari bottom dengan menentukan tiap-tiap objek membentuk klaster masing-masing hingga ke up yaitu, mengelompokkan setiap pasangan klaster paling mirip tahap demi tahap sampai membentuk sebuah klaster tunggal. Pasangan yang mirip ini merupakan pasangan yang memiliki peningkatan error sum of square paling minimum.
Pengujian dilakukan untuk menganalisis hasil pengelompokkan Ward’s method berdasarkan parameter error sum of square(ESS), Cophenetic Correlation Coefficient(CPCC), FMeasure, dan waktu eksekusi. Penambahan jumlah dokumen uji dan topik pada koleksi dokumen uji menyebabkan perubahan nilai ESS yang cenderung semakin meningkat. Selain itu, penambahan jumlah dokumen uji juga mempengaruhi nilai CPCC, nilai tertinggi diperoleh koleksi dengan jumlah terkecil(terdiri dari 10 dokumen) yaitu 0,9519(kualitas hirarki klaster sebesar 95,19%). Sedangkan berdasarkan FMeasure dan waktu eksekusi, rata-rata FMeasure tertinggi menunjukkan nilai keakurasian dalam pengelompokkan diperoleh complete linkage yang merupakan metode pembanding. Meskipun begitu dilihat dari waktu eksekusinya, Ward’s method lebih cepat dalam melakukan pengelompokkan.Kata Kunci : pengelompokkan dokumen, agglomerative hierarchical clustering,ABSTRACT: The growth of number and variety information for example news article, consumer more difficult looking for wanted information. Hence text grouping the article is needed by applying one of technique which related to Data Mining, that is “ clustering ”.
The clustering method that is used is Ward’s method, a method applying principle of agglomerative hierarchical clustering having the character of bottom up where grouping object is formed hierarchyly started from bottom by determining every object form each cluster till to up that is grouping the most similar couple level by level until all element object in one cluster. The most similar couple is couple whose fusion results in the most minimum increase of error sum of square.
Examination performed to analyze result of grouping Ward’s method based on parameters of error sum of square(ESS), Cophenetic Correlation Coefficient( CPCC), FMeasure, and execution time. Addition of number testing document and topic in the collection cause changing ESS tend more increase. While addition of number testing document also influences value of CPCC, the highest value is got by the collection that has the fewest number (consist of 10 document) that is 0,9519(quality of cluster hierarchy is 95,19%). While based on FMeasure and execution time, average of the highest FMeasure indicates accuration value in grouping obtained by complete linkage which is as comparation method. eventhough Ward’s method is quicker in the grouping seen from the execution time.Keyword: grouping document, agglomerative hierarchical clustering, Ward’s method, error sum of square, cophenetic correlation coefficient, FMeasure.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

PENGELOMPOKKAN ARTIKEL BERITA DENGAN MENGGUNAKAN METODE WARD'S HIERARCHICAL CLUSTERING
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

NITA MARTA ASIH
Perorangan
Yanuar Firdaus A.W., Warih Maharani
 

Penerbit

Universitas Telkom
Bandung
2010

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini