ABSTRAKSI: Sifat email yang murah, cepat dan tepat berdampak pada pemanfaatan yang tidak
tepat untuk mengirimkan pesan - pesan ke banyak orang. Pesan ini dinamakan
unsolicited bulk email, junk mail, atau spam e-mail. Akibat adanya spam ini,
banyak pengguna email maupun ISP dirugikan dengan biaya yang tidak sedikit
dan juga oleh perkembangan jumlah spam terhadap email traffic terus meningkat
dari tahun ke tahun. Sehingga perlu adanya suatu mekanisme otomatis untuk
mencegah masuknya spam ke dalam inbox email pemakai. Dalam Tugas Akhir
yang berjudul “Analisa dan Implementasi Personalized Spam Filtering
Menggunakan Jaringan Syaraf Tiruan” ini data mining digunakan untuk
memutuskan apakah suatu email yang diterima oleh user / pengguna email adalah
suatu email spam atau non-spam dan sebagai studi kasus ECML PKDD 2006
Discovery Challenge Data Mining Competition dengan data email yang telah
dikodekan menjadi bag-of-word vector space sehingga tidak diketahui secara pasti
bentuk sebenarnya dari email tersebut. Dan menggunakan metoda Information
Gain (IG) sebagai data preprocessing pada feature selection dan Jaringan Syaraf
Tiruan (JST) sebagai text classification serta algoritma genetika untuk melatih
bobot – bobot pada JST.Kata Kunci : spam filtering, text classification, data preprocessing, information gain, Jaringan Syaraf Tiruan, algoritma genetika.ABSTRACT: Email characteristics of low cost, high-speed, and convenient impact on the
unappropriate use to send messages to a large number of people. These messages
are called unsolicited bulk email, junk mail, or spam. Because of this spam, many
users who have email or ISP gain much financial loss and also the development
of spam to email traffic is increases every year. Therefore, users need to develop
automatic classifier that can distinguish between spam and non-spam (ham). In
this Final task which the topics are “ Analyse and implementation Personalized
Spam Filtering Using Artificial Neural Network ” Data Mining is used to decide
whether the e-mail is a spam or a ham and as the case study ECML-PKDD 2006
Discovery Challenge Data Mining Competition with e-mail that has been encoded
as bag-of-word vector space so we don’t know the content of that e-mail, and
using information gain as data preprocessing for the feature selection and
Artificial Neural Network (ANN) as the text classification and genetic algorithm
for training ANN’s weights.Keyword: spam filtering, text classification, data preprocessing, information gain, Artificial Neural Network, Genetic Algorithm.