Analisis Opinion Spam pada Product Review dengan Menggunakan Metode Logistic Regression

Amita Desmarani

Informasi Dasar

113080240
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Product review banyak digunakan oleh calon pembeli untuk melihat opini pembeli lainnya, sebelum memutuskan untuk membeli suatu produk. Kumpulan review produk tersebut juga digunakan oleh perusahaan untuk mengidentifikasi permasalahan produk yang dipasarkannya serta menemukan informasi strategi pemasaran perusahaan pesaingnya.

Akan tetapi karena tidak ada quality control tentang penulisan review yang dapat dipercaya, maka setiap orang bebas untuk memberikan opininya sehingga tidak jarang kesempatan tersebut dimanfaatkan oleh spammer. Ada tiga jenis spam pada product review yaitu untruthfull opinions, reviews on brand only, dan non-review.

Metode yang dipilih untuk menyelesaikan kasus review spam ini adalah Logistic Regression karena dapat menghasilkan estimasi probabilitas suatu review merupakan spam atau bukan seperti yang dibutuhkan. Dalam tugas akhir ini keseluruhan sistem dibagi menjadi dua, yaitu proses klasifikasi untuk spam 1 dan proses klasifikasi untuk spam 2 dan 3. Untuk klasifikasi spam 2 dan 3 akan dilakukan pelabelan manual terlebih dahulu, kemudian dilakukan proses preprocessing untuk menemukan variabel prediksi yang diinginkan. Karena pada proses klasifikasi spam 1 tidak dilakukan pelabelan manual, maka terlebih dahulu akan dipisahkan review duplikat dan non duplikatnya dengan metode shingling dimana nanti review duplikat akan dianggap sebagai spam dan sisanya sebagai non spam untuk kemudian akan dianalisis karakteristik spam tipe 1. Dari hasil analisis tersebut diperoleh karakteristik spam 1 yang banyak menjadi target spammer adalah yang memiliki rating baik dan rata-rata (rating 3-5), untuk selanjutnya akan diberi review spam negatif untuk menjatuhkan produk tersebut.Kata Kunci : Logistic regression, klasifikasi, duplikat, spamABSTRACT: Product reviews contain rich user opinions on quality products. They are used by potential customers to find opinions of existing users before deciding to purchase a product. The product reviews also used by product manufacturers to identify product problems and to find marketing intelligence information about their competitors.

However, because there is no quality control on writing reviews that can be trusted, then everyone is free to give his opinion that it is not uncommon opportunity exploited by spammers. There are three types of spam on product reviews are untruthfull opinions, reviews on the brand only, and non-review.

The method chosen to solve this case is the Logistic Regression because it can produce estimates of the probability of a review is spam or not as required. In this case, the whole system is divided into two system, first for classification to spam 1 and the second is classification to spam 2 and 3. For classification spam 2 and 3 will be done by manually labeling first, then do the preprocessing to find the desired predictive variables. Due to the spam 1 classification, manual labeling is not done, so it will be separated of review duplicate and non-duplicate by the shingling method first. In which later the duplicate review will be considered as spam and the rest as non-spam. And then, it would be analyzed the characteristics of spam type 1. From the analysis, we obtained that characteristics of spam 1 became a target of spammers are from review which have a good or average quality product (rating 3-5), an then they will give a negative review spam to drop the product.Keyword: Logistic regression, classification, duplicate, spam

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis Opinion Spam pada Product Review dengan Menggunakan Metode Logistic Regression
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Amita Desmarani
Perorangan
Warih Maharani, Ema Rachmawati
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini