ABSTRAKSI: Naïve Bayes merupakan salah satu teknik pengklasifikasian dalam data mining dengan menerapkan teorema Bayes dalam pengolahannya dan memberikan hasil optimal bila setiap atribut dalam dataset saling bebas. Namun pada umumnya, suatu dataset memiliki atribut numerik dan atribut nominal yang tidak saling bebas sehingga apabila dianggap saling bebas maka dapat menimbulkan permasalahan classification error. Oleh karena itu dibutuhkan suatu metode untuk meminimalkan nilai error rate pada kesalahan pengklasifikasian tersebut, salah satu metodenya adalah strategi pendiskritan. Diskritisasi adalah sebuah metode yang memetakan beberapa nilai numerik (X) ke sebuah interval bernilai nominal (X) berdasarkan pengaturan frekuensi di dalam satu interval sehingga bisa di dapatkan jumlah interval terbentuk dalam satu atribut numerik.
Salah satu metode pendiskritisasian yang diterapkan dalam Tugas Akhir ini adalah Optimal Flexible Frequency Discretization (OFFD) yang berbasis sequential search dan wrapper based supervised untuk incremental learning. Pada metode ini akan dilakukan feature selection dengan teknik wrapper untuk mendapatkan atribut yang optimal berdasarkan parameter fmeasure nya. Selanjutnya data dengan atribut optimal tersebut akan didiskrit secara sequential search untuk nilai frekuensi minimum tiap interval.
Kata Kunci : Wrapper based, Feature Selection, Diskritisasi, Sequential Search, Naïve Bayes Classifier, frekuensi interval, tingkat kesalahaanABSTRACT: Naive Bayes is one of the classification techniques in data mining that apply Bayes Theorem in its processing and provide optimal result when each attributes in dataset is independent. But generally, a dataset has numeric attributes and nominal attributes are dependence so that if considered independent, it can cause classification error problems. Therefore, it needs a method to minimize the error rate, the method is discretize strategy. Discretization is a method that maps some numerical values (X) into an interval of nominal value (X) based on the frequency setting in one interval so it can get number of interval formed in one numeric attribute.
One of discretization method adopted in this Final Project is Optimal Flexible Frequency Discretization (OFFD) based on sequential search and wrapper based supervised for incremental learning. This method will be carried out wrapper feature selection to get optimal attributes based on its fMeasure parameter. Then, optimal dataset will de discrete in sequential search for the minimum frequency on each interval.
Keyword: wrapper based, Feature Selection, discretization, sequential search, Naïve Bayes Classifier, interval frequency, error rate