ABSTRAKSI: E-mail spam adalah pengiriman pesan yang tidak diinginkan melalui e-mail dan dikirimkan dalam jumlah besar kepada siapapun. Para pengguna layanan e-mail terpaksa menerima e-mail spam tersebut, sehingga banyak pengguna layanan e-mail yang membuang waktunya dengan percuma untuk memilah e-mail yang masuk ke inbox mereka. Oleh karena itu, e-mail spam filtering banyak dikembangkan saat ini.
Dalam tugas akhir ini, dibangun sebuah sistem e-mail spam filtering dengan menggunakan Granular computing, support vector machine, dan undersampling untuk memecahkan masalah klasifikasi imbalance. Performansi sistem diukur dengan menggunakan g-mean.
Ada dua metode agregasi yang digunakan dalam penelitian ini, yaitu combine dan discard. Namun, metode combine memberikan hasil yang lebih memuaskan dibandingkan metode discard, dengan akurasi sebesar 83,59%. Hal ini disebabkan oleh banyaknya data informatif yang terekstrak, sehingga meminimalkan efek information loss.Kata Kunci : Granular computing, e-mail spam filtering, undersampling, klasifikasi, support vector machine, granular support vector machine.ABSTRACT: E-mail spam means sending unsolicited messages via e-mail and sent in bulk to anyone. The e-mail service users are forced to receive the e-mail, so many users waste their time to sorting their e-mails that comes into their inboxes. Therefore, many e-mail spam filtering has been developed at this time.
In this work, we built an e-mail spam filtering system using granilar computing, support vector machines, and undersampling to solve the imbalanced classification problem. The system performance is measured by using the g-mean.
There are two methods of agregation used in this study, combine and discard. However, combine gives more satisfactory result than discard method, with 83,59% accuracy. It is because there are many informative data that are extracted, so it minimize the effect of information loss.Keyword: Granular computing, e-mail spam filtering, undersampling, klasifikasi, support vector machine, granular support vector machine.