ABSTRAKSI: Imbalance class adalah salah satu permasalahan yang ada dalam data mining. Permasalahan ini diakibatkan karena adanya jumlah data yang tidak seimbang pada kelas yang berbeda, dimana kelas yang satu memiliki jumlah data yang sangat banyak (mayoritas), sedangkan kelas lainnya memiliki jumlah data yang sangat sedikit (minoritas). Pada pengklasifikasian biasa, kelas minoritas tersebut tidak dapat terprediksi. Hal ini disebabkan karena bila jumlah data pada satu kelas sangat kecil, kelas tersebut akan salah diprediksi sebagai kelas mayoritas.
Salah satu metode klasifikasi yang biasa digunakan adalah metode decision tree. Metode decision tree ini akan membentuk model seperti flow chart dengan struktur tree. Pada Tugas Akhir ini diperbandingkan tiga algoritma pada decision tree yaitu C4.5, CART, dan HDDT. Setiap algoritma tersebut memiliki splitting criterion atau attribute selection measure yang berbeda dengan tingkat sensitivitas yang berbeda pula terhadap kecondongan data.
Analisis yang dilakukan pada Tugas Akhir ini adalah mengetahui bagaimana performansi dari algoritma C4.5, CART, dan HDDT yang memiliki splitting criterion yang berbeda pada permasalahan imbalance class serta bagaimana perbandingan performansi dari ketiga algoritma decision tree tersebut berdasarkan nilai precision, recall, dan f-measure.
Hasil yang didapat dari penelitian menunjukkan bahwa algoritma HDDT memiliki performansi yang lebih baik pada tingkat imbalance yang rendah dibandingkan algoritma CART dan C4.5. Hal ini disebabkan karena algoritma HDDT memiliki tingkat sensitivitas yang rendah terhadap kecondongan data yang menjadi masalah dalam imbalance class.Kata Kunci : imbalance class, algoritma C4.5, CART, HDDT, performansi.ABSTRACT: Imbalance class is one of existing problems in data mining. This problem is caused by number of data in which is uneven in the different class, where the one of the class own the number of a lot of data ( majority), while the other classes own a little the number of data ( minority). In the ordinary classification, the minority class cannot classified. This is caused by when the number of data in the very small class, the class will be wrong classified as majority class.
One of classification method which commonly use is decision tree method. This method will form model like flow chart with structure tree. In this final project is comparing three algorithm of decision tree that is C4.5, CART, and HDDT. Every algorithm own splitting criterion or different attribute selection measure with level of different sensitivities also to data skewnes.
The analysis in final project is knowing how performance from the C4.5, CART, and HDDT algorithm owning different splitting criterion in problems of imbalance class and also how comparison of performance from third of the algorithm decision tree based on value of precision, recall, and f-measure.
The result from this research present that HDDT algorithm own better performance at low level of imbalance compared to CART and C4.5 algorithm. This is caused by algorithm of HDDT own level of low sensitivities to skewness of data becoming internal issue of imbalance class.Keyword: imbalance class, algorithm C4.5, CART, HDDT, performance.