Informasi Umum

Kode

113080240

Klasifikasi

005.1 - Computer programming

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Rekayasa Perangkat Lunak

Dilihat

14 kali

Informasi Lainnya

Abstraksi

ABSTRAKSI: Product review banyak digunakan oleh calon pembeli untuk melihat opini pembeli lainnya, sebelum memutuskan untuk membeli suatu produk. Kumpulan review produk tersebut juga digunakan oleh perusahaan untuk mengidentifikasi permasalahan produk yang dipasarkannya serta menemukan informasi strategi pemasaran perusahaan pesaingnya.<br><br>Akan tetapi karena tidak ada quality control tentang penulisan review yang dapat dipercaya, maka setiap orang bebas untuk memberikan opininya sehingga tidak jarang kesempatan tersebut dimanfaatkan oleh spammer. Ada tiga jenis spam pada product review yaitu untruthfull opinions, reviews on brand only, dan non-review.<br><br>Metode yang dipilih untuk menyelesaikan kasus review spam ini adalah Logistic Regression karena dapat menghasilkan estimasi probabilitas suatu review merupakan spam atau bukan seperti yang dibutuhkan. Dalam tugas akhir ini keseluruhan sistem dibagi menjadi dua, yaitu proses klasifikasi untuk spam 1 dan proses klasifikasi untuk spam 2 dan 3. Untuk klasifikasi spam 2 dan 3 akan dilakukan pelabelan manual terlebih dahulu, kemudian dilakukan proses preprocessing untuk menemukan variabel prediksi yang diinginkan. Karena pada proses klasifikasi spam 1 tidak dilakukan pelabelan manual, maka terlebih dahulu akan dipisahkan review duplikat dan non duplikatnya dengan metode shingling dimana nanti review duplikat akan dianggap sebagai spam dan sisanya sebagai non spam untuk kemudian akan dianalisis karakteristik spam tipe 1. Dari hasil analisis tersebut diperoleh karakteristik spam 1 yang banyak menjadi target spammer adalah yang memiliki rating baik dan rata-rata (rating 3-5), untuk selanjutnya akan diberi review spam negatif untuk menjatuhkan produk tersebut.Kata Kunci : Logistic regression, klasifikasi, duplikat, spamABSTRACT: Product reviews contain rich user opinions on quality products. They are used by potential customers to find opinions of existing users before deciding to purchase a product. The product reviews also used by product manufacturers to identify product problems and to find marketing intelligence information about their competitors.<br><br>However, because there is no quality control on writing reviews that can be trusted, then everyone is free to give his opinion that it is not uncommon opportunity exploited by spammers. There are three types of spam on product reviews are untruthfull opinions, reviews on the brand only, and non-review.<br><br>The method chosen to solve this case is the Logistic Regression because it can produce estimates of the probability of a review is spam or not as required. In this case, the whole system is divided into two system, first for classification to spam 1 and the second is classification to spam 2 and 3. For classification spam 2 and 3 will be done by manually labeling first, then do the preprocessing to find the desired predictive variables. Due to the spam 1 classification, manual labeling is not done, so it will be separated of review duplicate and non-duplicate by the shingling method first. In which later the duplicate review will be considered as spam and the rest as non-spam. And then, it would be analyzed the characteristics of spam type 1. From the analysis, we obtained that characteristics of spam 1 became a target of spammers are from review which have a good or average quality product (rating 3-5), an then they will give a negative review spam to drop the product.Keyword: Logistic regression, classification, duplicate, spam

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama Amita Desmarani
Jenis Perorangan
Penyunting Warih Maharani, Ema Rachmawati
Penerjemah

Penerbit

Nama Universitas Telkom
Kota Bandung
Tahun 2012

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi