Klasifikasi Hirarki Dokumen Berita Berbahasa Indonesia

Nashiratunnisa

Informasi Dasar

113050089
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Saat ini jumlah informasi seperti artikel berita yang ada di dalam web terus berkembang dengan cepat. Banyaknya jumlah informasi tersebut bisa menyebabkan pengguna mengalami kesulitan dalam mencari informasi yang penting. Salah satu komponen Data Mining yaitu Text Categorization yang merupakan suatu cara untuk mengelompokkan dokumen ke dalam kelas-kelas tertentu. Salah satu penggunaan Text Categorization adalah Klasifikasi Hirarki yaitu suatu cara memberikan kelas hirarki atau kelas spesifik ke suatu dokumen sehingga dokumen dapat terorganisasi dengan baik.
Beberapa algoritma yang digunakan dalam klasifikasi hirarki adalah algoritma top down with parent preference, bottom up with parent support, bottom up with threshold. Dengan ketiga algoritma tersebut, dokumen akan dikelompokkan dengan memperhatikan hubungan tiap kelas yang ada dalam tree hirarki yang telah ditentukan sebelumnya.
Pada Tugas Akhir ini dilakukan perbandingan performansi antara ketiga algoritma dengan menggunakan beberapa metode klasifikasi sebagai pembentuk classifiernya, yaitu metode Centroid Sum dan Naive Bayes Multinomial. Parameter performansi yang digunakan adalah hierarchical precision, hierarchical recall, dan f- measure. Hasil percobaan menunjukan bahwa algoritma top down with parent preference memberikan performansi yang lebih baik dibandingkan dengan algoritma bottom up with threshold, algoritma top down with parent preference dan bottom up with parent support mempunyai nilai performansi yang sama.
Kata Kunci : text categorization, klasifikasi hirarki, top down with parent preference, bottom up with parentABSTRACT: Nowadays, the amount of information such as news article that exist in web keep growing fast. This tremendous sum could make the users find some difficulties in finding the right urgent information. One of Data Mining task, Text Categorization, is one of the ways to classify the documents into class or certain class. One of Text Categorization usage is Hierarchical Classification which is a way to give hierarchy class or specific class into a document so that document could be organized well.
One of the algorithms that can be used in hierarchical classification is algorithm of top down with parent preference, buttom up with parent support, buttom up with threshold. The documents can will be grouped by observing the relation between each classes in a predefined hierarchy tree.
In this paper,we compare the performance between the three algorithms by using some classification methods, Centroid Sum and Naive Bayes Multinomial. The Parameter used here is the hierarchical precision, hierarchical recall, and f-measure. The experiment show that top down with parent preference algorithm is giving a better result than buttom up with threshold, top down with parent preference and bottom up with parent support have the same performantion.
Keyword: text categorization, centroid based classifier, centroid vector, akurasi, f- measure.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Klasifikasi Hirarki Dokumen Berita Berbahasa Indonesia
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Nashiratunnisa
Perorangan
M. Arif Bijaksana, Angelina Prima Kurniati
 

Penerbit

Universitas Telkom
Bandung
2009

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini