ANALISA PENAMBAHAN TEMPORAL INFORMATION PADA METODE TRUSTRANK UNTUK DETEKSI WEB SPAM <BR> Analysis of Additional Temporal information on TrustRank Method for Detection of Web Spam

RAHADIAN SETYA SUKMANA

Informasi Dasar

113060034
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Trustrank, sebuah metode perankingan web yang berusaha untuk mengatasi link based spam dengan mengusung ide bahwa web non spam tidak pernah mereferensi web spam. Cara yang diusulkan metode ini adalah dengan membentuk seed set yang berisi beberapa web yang telah diketahui secara pasti statusnya sebagai web non spam. Kemudian dari seed set nilai trust didistribusikan ke seluruh web di luar seed set. Semakin jauh jarak web dari seed set, maka semakin kecil kemungkinan web tersebut mendapat distribusi nilai trust.

Namun pada kenyataannya web spam dapat mendapatkan referensi dari web non spam meskipun dengan cara curang, bahkan dengan jumlah yang banyak dalam waktu yang cukup singkat. Fenomena demikian yang membuat performansi Trustrank menjadi buruk dalam menyatakan nilai trust.

Hal yang diusulkan dalam penelitian ini adalah menambahkan faktor IGR dengan Trustrank. IGR adalah faktor yang digunakan untuk mengetahui perubahan struktur inlink web. Semakin besar nilai IGR maka semakin besar kemungkinan web tersebut web spam, dan semakin kecil nilai trust yang harus diterima oleh web tersebut.

Hasil penelitian menunjukkan bahwa penambahan faktor IGR pada Trustrank mampu memberikan perangkingan yang lebih adil. Web spam yang sebelumnya banyak mendominasi urutan bucket teratas turun secara drastis di bucket-bucket akhir.Kata Kunci : TrustRank, web spam, seed set, IGR, bucket.ABSTRACT: Trustrank, a web ranking method that seeks to overcome the link-based spam and brought the idea that non-spam website has never reference the web spam. How the proposed method is to form the seed set that contains several web that has been known for certain status as non-spam website. Then from the seed set trust values distributed across the web that out of seed set. The farther distance from the seed set the web is less likely to get the distribution of trust values.

But in fact the web spam can get references from the non-spam web, although by indecent trick, even with significant amounts in a short amount of time. This phenomenon makes the performance of TrustRank to assign the fairness value of trust become worse.

This research proposes the modification of TrustRank algoritm by adding IGR factor. IGR is a factor used to determine changes in the structure of the web Inlink. The greater value IGR of web is more likely detected as web spam, and the smaller value of the trust must be accepted by the web.

The results showed that the addition of IGR factor in Trustrank algorithm provide a more fair ranking. Web spam that previously dominated much of the order of the top bucket drops drastically at the end of the bucket.Keyword: TrustRank, web spam, seed set, IGR, bucket.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

ANALISA PENAMBAHAN TEMPORAL INFORMATION PADA METODE TRUSTRANK UNTUK DETEKSI WEB SPAM
Analysis of Additional Temporal information on TrustRank Method for Detection of Web Spam
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

RAHADIAN SETYA SUKMANA
Perorangan
Kiki Maulana, Angelina Prima Kurniati
 

Penerbit

Universitas Telkom
Bandung
2011

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini