Implementasi Metode Maximum Entropy Pada Pendeteksian Spam Opinion (Junk Post) dalam Forum

Rio Bayu Prayogo

Informasi Dasar

113081022
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Sebagai salah satu media bertukar informasi, peran forum sangat penting di masyarakat. Dari opini-opini yang ada di dalam forum, tidak semua opini tersebut berguna sehingga terkadang menyulitkan pihak-pihak yang membutuhkan informasi yang terkait. Opini yang tidak diperlukan tersebut sering disebut sebagai junk post. Text Classification merupakan salah satu solusi yang dapat mengklasifikasikan antara opini yang berguna dan junk post. Pada Tugas Akhir ini metode yang digunakan untuk melakukan Text Classification adalah Maximum Entropy. Dengan Maximum Entropy dilakukan proses learning menggunakan data train untuk membentuk model berupa nilai lamda. Dalam proses pembentukan model Maximum Entropy dilakukan pemilihan fitur dengan memanfaatkan nilai TF, IDF dan penghilangan stopword. Model yang telah terbentuk digunakan untuk melakukan klasifikasi terhadap data test yang akan diujikan. Pada penelitian ini, perfomansi klasifikasi dengan menggunakan fitur yang terpilih melalui proses TF menghasilkan hasil yang lebih baik jika dibandingkan dengan penggunaan IDF selain itu penghilangan stopword juga sangat berpengaruh terhadap perfomansi sistem. Hasil evaluasi menunjukkan metode Maximum Entropy mampu menyelesaikan permasalahan junk post ini.Kata Kunci : text classification, junk post, Maximum Entropy, TF, IDF, pemilihan fiturABSTRACT: As a medium of exchange of information, forums have a very important role in the community. Of the opinions expressed in the forum, not all of the opinion useful, it is sometimes complicate the parties who need the information related. Opinions are not necessary is often referred to as junk post. Text Classification is one solution that can classify between junk post and the useful opinions. In this final project, method that used for text classification is Maximum Entropy. Maximum Entropy do the learning process using train data to build model as lamda value. In the process of building Maximum Entropy model,the feature selection process is done by utilizing the value of TF, IDF and stopword removal. Model that already builded is used to classify test data. In this project, classification performance using features selected through a process of TF produce better results when compared with the use of the IDF also the using of stopword removal have big influence to sistem performance. The evaluation results showed the Maximum Entropy method is able to solve the problems of junk post.Keyword: text classification, junk post, Maximum Entropy, TF,IDF, feature selection

Subjek

Informatika Teori dan Pemrograman
 

Katalog

Implementasi Metode Maximum Entropy Pada Pendeteksian Spam Opinion (Junk Post) dalam Forum
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Rio Bayu Prayogo
Perorangan
Ade Romadhony, Ema Rachmawati
 

Penerbit

Universitas Telkom
Bandung
2013

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini