ABSTRAKSI: Churn prediction adalah suatu cara untuk memprediksi pelanggan yang berpotensial untuk churn. Data yang dipakai dalam churn prediction bersifat imbalance. Akurasi metode klasifikasi biasa akan berkurang pada saat dihadapkan dalam persoalan data imbalance. Hasil klasifikasi akan lebih condong ke bagian data yang memiliki komposisi data yang lebih besar.
Salah satu cara untuk menangani permasalahan ini adalah dengan menggunakan metode klasifikasi Support Vector Machine(SVM). Metode SVM ini mempunyai varian yaitu SVM tanpa pruning (SVM balance dan SVM imbalance) dan pruning SVM.
Analisis yang dilakukan pada tugas akhir ini adalah mengetahui bagaimana pengaruh berbagai varian dari metode SVM yang digunakan terhadap akurasi prediksi data churn dengan melakukan penghitungan akurasi model churn prediction yang dinyatakan dalam bentuk lift curve, top decile dan gini coefficient serta F-measure untuk penghitungan akurasi prediksi data sebagai data yang imbalance.
Hasil yang didapat dari penelitian menunjukkan bahwa metode pruning SVM tidak dapat meningkatkan akurasi dari SVM tanpa pruning. Varian dari metode SVM yang terbaik untuk mengatasi masalah churn prediction adalah SVM imbalance.
Kata Kunci : churn prediction, imbalance, pruning, evaluasi.ABSTRACT: Churn prediction is a method to predict behaviour of customers who potentially for being churn. Data which is used in churn prediction have the imbalance characteristic. The accuracy of common classification method will decrease when it used on imbalance data. Classification result will be inclined to part data which has greater composition side.
One method to handle this problem is use Support Vector Machine(SVM) method. This method has some variant which is SVM without pruning (SVM balance and SVM imbalance) and SVM with pruning.
The analysis in this final exam is knowing how the effect of pruning SVM and SVM without pruning method to accuration of churn prediction by counting lift curve, top decile, and gini coefficient as accuration of churn prediction model, and also counting F-measure as accuration of imbalance case .
The result from this research show that pruning SVM method can’t increase accuration of SVM without pruning method. The best method from several variant of SVM to solve churn prediction problem is SVM imbalance.
Keyword: churn prediction, imbalance, pruning, evaluation.