ABSTRAKSI: Menyingkirkan e-mail yang tidak diinginkan (spam) dalam jumlah banyak secara manual akan sangat melelahkan. Namun dengan mekanisme spam filtering, hal itu dapat diatasi. Spam filtering akan mem-blok spam secara otomatis berdasarkan rule-rule tertentu. Semakin berkembangnya teknik spamming dari waktu ke waktu akan meningkatkan variasi rule. Penentuan rule secara manual tentu saja akan memakan waktu.
Oleh karena itu diperlukan suatu mekanisme pembangkitan rule secara otomatis berdasarkan data-data yang sudah ada. Metode yang paling cocok untuk masalah ini adalah dengan menggunakan teknik learning. Teknik ini dapat menemukan rule secara otomatis dan diharapkan dapat berlaku umum untuk datadata yang belum diketahui. Salah satu teknik learning yang dapat dipakai adalah metode Grammatical Evolution (GE).
GE dapat menghasilkan solusi berupa fungsi/program yang berbasis grammar. Grammar yang dibangun akan disesuaikan dengan masalah tersebut. Dengan kemampuan ini, GE digunakan untuk menghasilkan rule yang berupa program untuk kemudian dijadikan acuan untuk proses klasifikasi.
Dalam tugas akhir ini, dibuat perangkat lunak untuk mengimplementasikan metode GE untuk proses pembangkitan rule dan klasifikasi pada spam filtering. Hasil yang didapat menunjukkan bahwa penentuan grammar yang lebih kompleks memberikan akurasi yang lebih tinggi, begitu juga dengan meningkatkan parameter ukuran kromosom dan crossover rate. Sedangkan perubahan ukuran populasi dan mutation rate tidak mempengaruhi akurasi.
Kata Kunci : spam filtering, rule, grammatical evolution, klasifikasi.ABSTRACT: Eliminating unwanted e-mail (spam) in large amount manually can be exhausting. However, spam filtering mechanism can solve this problem. Spam filtering blocks spam automatically based on specified rules. More developed spamming technique over time will increased rule variation. Specify rules manually surely can be time consuming.
Therefore need an automatic rule(s) generation mechanism according to existing data. Suitable method for the problem is learning technique. The technique can found rules automatically and expect it to be generally valid for unclassified data. One of the technique can be used is Grammatical Evolution (GE) method.
GE can produce solutions in function/program form based on grammar. Evolved grammar suited to the problem of interest. With this capability, GE used for producing rules in program form then it is referable for classification process.
In this final project we made software to implement GE method for rule generation process and classification on spam filtering. The results show that defined more complex grammar has given higher accuracy as well as increasing chromosome size and crossover rate. However varied population size and mutation rate doesn’t give much effect on accuracy.
Keyword: spam filtering, rule, grammatical evolution, classification.