ABSTRAKSI: Data mining merupakan proses analisa data untuk menemukan suatu pola dan aturan menggunakan perangkat lunak, yang mampu menganalisa data dalam jumlah besar menjadi informasi berupa pola yang mempunyai arti bagi pendukung keputusan. Salah satu teknik dalam data mining adalah klasifikasi. Klasifikasi bertujuan membangun model yang membedakan kelas data, untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui
Dalam tugas akhir ini dibuat suatu perangkat lunak yang mengimplementasikan salah satu metode dalam klasifikasi yaitu decision tree dengan gabungan algoritma BOAT dan C4.5. BOAT (Bootstrapped Optimistic Algorithm for Tree Construction) merupakan salah satu algoritma klasifikasi yang menggunakan decision tree. BOAT menggunakan bootstrap untuk membantu mempercepat waktu proses pembentukan decision tree. Pengaturan bootstrap meliputi ukuran numbag dan bagsize yang digunakan. Bagsize merupakan ukuran sampel data yang digunakan untuk membentuk decision tree, dan numbag adalah jumlah pohon yang dibentuk dari sampel data yang ditentukan. Pohon yang dibentuk kemudian di combine hingga didapat tree akhir.
Hasil pengujian menunjukkan gabungan BOATC4.5 memiliki performansi waktu lebih baik dari C4.5 untuk bagsize dan numbag yang berukuran kecil, memiliki bentuk pohon yang sama untuk data yang bebas dari noise. Untuk data yang memiliki noise dengan tipe outlier, bentuk pohon berbeda tetapi nilai akurasi BOATC4.5 tidak lebih rendah dari akurasi C4.5.
Kata Kunci : data mining, decision tree, C4.5, BOAT, bagsize, numbagABSTRACT: Data mining is a data analyze process to find a pattern and rule using software, can analyze big quantities data to information in a pattern that have meanings to decision support. Classification is one of the technique of data mining. Classification purpose to build a model that can differ data class, with an aim to guess class from an unknown label object.
In this final assignment, a software is made to implement a classification method known as decision tree with joining the BOAT and C4.5 algorithm. BOAT uses bootstrap to help fasten the decision tree form process. Bootstrap preferences include the numbag size and bagsize that is used. Bagsize is data sample size used to form decision tree, and numbag is the tree quantity formed from the data sample. Trees that are formed then is being combined until it gets the final tree.
The testing result shows that BOATC4.5 has a better time performance than C45 with a small number of bagsize and numbag, has the same form of tree for data without noise. For data's with an outlier type of noise, the tree form is different but the accuracy value of BOATC4.5 is not lower than C4.5 accuracy.
Keyword: data mining, decision tree, C4.5, BOAT, bagsize, numbag