Meningkatkan Kinerja “Pengklasifikasian Multi-Class Text Dengan Metode Naïve Bayes” Menggunakan Error-Correcting Output Coding (ECOC) Improving “Multi-Class Text Classification with Naive Bayes” using Error-Correcting Output Coding (ECOC)

Dicky Triono Yunanto

Informasi Dasar

113020212
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Terdapat banyak sekali dokumen teks yang tersedia dalam bentuk elektronik. Dan semakin banyak dari hari ke hari. Dokumen-dokumen tersebut mewakilkan sejumlah informasi yang sangat banyak yang dapat diakses dengan sangat mudah. Mencari nilai dalam koleksi yang sangat banyak ini memerlukan semacam organisasi; sebagian besar dari kegiatan mengorganisasi dokumen dapat diotomasi melalui klasifikasi teks. Akurasi dan tingkat pemahaman atas sistem yang digunakan dapat meningkatkan kegunaannya secara signifikan.
Dalam Tugas Akhir ini dilakukan penelitian tentang peningkatan kinerja Naïve Bayes Classifier pada klasifikasi multiclass dengan menggunakan errorcorrecting output coding (ECOC), dalam implementasinya untuk mengklasifikasikan dokumen berita ke dalam sebuah kategori kelas berita. Dataset yang digunakan adalah berita berbahasa Indonesia dari beberapa website berita.
Hasil penelitian menunjukan bahwa penggunaan ECOC dapat meningkatkan akurasi pengklasifikasian dengan menggunakan Naïve Bayes Classifier sampai dengan tingkat akurasi 85% dan dapat dijelaskan mengapa peningkatan ini dapat terjadi. Peningkatan dalam akurasi ini harus dibayar dengan adanya peningkatan dalam lama waktu training, yang berbanding lurus dengan panjang code. Dalam Tugas Akhir ini, penelitian terhadap pengklasifikasian ECOC dilakukan dengan menggunakan panjang code yang berbeda-beda, dan dicari yang menghasilkan akurasi paling baik untuk dibandingkan dengan metode Naive Bayes murni.Kata Kunci : text mining, klasifikasi teks, multiclass, naïve bayes, error-correctingABSTRACT: There are abundant reserves of text document in electronic form, and is getting bigger each day. Those documents represent a bulk of information, those of which can be easily accessed. To find any value in this huge collection required some kind of organization; most of the task in document organization can be automated via text classification. Accuracy and the level of understanding of the system used can increase the function significantly.
This final assignment is a research to improve the performance of Naive Bayes Classifier in multiclass classification with the implementation of Error-Correcting output coding (ECOC), these methods are used to classify news documents into news class classification. The datasets used are news in bahasa Indonesia taken from several news website.
The research shows that the usage of ECOC can improve classification accuracy within the usage of Naive Bayes Classifier up to 66%. This improvement in accuracy was achieved in expense of increased training time, which coincides linearly with the code length used. In this final assignment, the research in ECOC Classifier was done with varying code length, in search of the threshold which resulted in the best accuracy in comparison with normal Naive Bayes Method.Keyword: text mining, text classification, multiclass, naïve bayes, errorcorrecting

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Meningkatkan Kinerja “Pengklasifikasian Multi-Class Text Dengan Metode Naïve Bayes” Menggunakan Error-Correcting Output Coding (ECOC) Improving “Multi-Class Text Classification with Naive Bayes” using Error-Correcting Output Coding (ECOC)
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Dicky Triono Yunanto
Perorangan
Moch. Arif Bijaksana, Angelina Prima Kurniati
 

Penerbit

Universitas Telkom
Bandung
2008

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini