PENANGANAN ATRIBUT BERVARIAN NOL PADA NAÏVE BAYES CLASSIFIER DENGAN STUDI KASUS PEMFILTERAN KONTEN PORNO PADA WEB BROWSER

Tamami Efendi

Informasi Dasar

113051011
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Internet telah mambawa banyak dampak positif dalam kehidupan manusia. Akan tetapi tidak dapat dipungkiri beberapa dampak negatif juga muncul akibat kebebasan informasi yang ditawarkan melalui media internet. Diantaranya adalah maraknya konten porno yang tersebar dengan bebas di dunia maya.
Untuk itulah diperlukan sebuah mekanisme pemfilteran konten porno yang secara cerdas dapat mengenali apakah suatu web page terindikasi mengandung konten porno atau tidak. Mekanisme pemfilteran yang dibahas pada tugas akhir ini menggunakan naive bayes classifier sebagai metode pengklasifikasian web page. Diharapkan dengan menggunakan naive bayes classifier didapatkan akurasi hasil klasifikasi yang tinggi meskipun masing-masing web page mempunyai bahasa yang berbeda yaitu Bahasa Indonesia dan English.
Dalam penerapan naive bayes classifier , web page harus di-preprocess terlebih dahulu. Web page akan diekstraksi menjadi token/atribut. Permasalahan muncul ketika ada token/atribut yang mempunyai varian nol yang dapat menyebabkan ketidakakuratan pada perhitungan posterior probability naive bayes classifier. Untuk mengatasi hal tersebut penulis menawarkan tiga alternatif penanganan atribut bervarian nol, yaitu pengabaian atribut bervarian nol, penambahan instance dummy, dan inisialisasi standar deviasi minimum. Selain itu juga dianalisis pengaruh penggunaan stopword removal pada preprocessing dalam meningkatkan hasil akurasi klasifikasi.
Ditunjukkan dalam tugas akhir ini bahwa alternatif terbaik dalam penanganan atribut bervarian nol adalah dengan menggunakan inisialisasi standar deviasi minimum dan penanganan stopword removal. Alternatif ini dapat menghasilkan nilai akurasi klasifikasi yang relatif tinggi yaitu 96%.Kata Kunci : naive bayes classifier , pemfilteran, porno, preprocess, stopword removal, atribut bervarian nolABSTRACT: Internet has many positive impacts in human life. But some of the negative effects also appear due to the freedom of information offered through the internet media. One of the negative effects is easy access to porn sites.
A mechanism is needed to filter porn content that can intelligently identify whether a web page contains porn content or not. The mechanism of filtering is discussed in this final project using naive bayes classifier method. It is expected that by using naive bayes classifier can be obtained high accuracy of the classfication results although each web page have different languages, Bahasa Indonesia and English.
In the implementation of naive bayes classifier , the web page must preprocess-first. Web page will be extracted to token / term. The problem appears when there are token / term variants that have a zero value that can cause inaccuracies in the calculation of posterior probability naive bayes classifier . Therefor, the author offers three alternatives attribute handling the token / term variants that have a zero value, they are the ignoring the token / term variants that have a zero value, the addition of dummy instance, and initiating the minimum standard deviation. It also analyzed the influence of the use of stopword removal on the preprocessing in improving the classification accuracy.
Shown in this final project that the best alternative in handling the token / term variants that have a zero value is initialising with the minimum standard deviation and stopword removal. The accuracy of this alternative is relatively high with 96%.Keyword: naive bayes classifier , filtering, porn, preprocess, stopword removal, zero variants token

Subjek

Rekayasa Perangkat Lunak
 

Katalog

PENANGANAN ATRIBUT BERVARIAN NOL PADA NAÏVE BAYES CLASSIFIER DENGAN STUDI KASUS PEMFILTERAN KONTEN PORNO PADA WEB BROWSER
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Tamami Efendi
Perorangan
Adiwijawa, Yanuar Firdaus A.W.
 

Penerbit

Universitas Telkom
Bandung
2009

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini