ABSTRAK
Churn prediction merupakan sebuah model yang dapat mengklasifikasikan apakah seorang pelanggan akan tetap menggunakan jasa sebuah perusahaan atau beralih menggunakan jasa perusahaan lain. Permasalahan utama yang dihadapi pada churn prediction ini adalah adanya imbalance data, ketidak seimbangan jumlah data pada 2 buah kelas. Pada tugas akhir ini digunakan teknik sampling untuk memodifikasi dataset, yaitu combine sampling (Neighbourhood cleaning rule & synthetic minority oversampling technique) untuk mengatasi permasalahan imbalance data. Data yang digunakan adalah data yang diperoleh dari perusahaan telekomunikasi. Data tersebut nantinya akan dilakukan proses NCL dan SMOTE, kemudian hasil dari ke 2 teknik sampling tersebut akan digabungkan sehingga menjadi dataset yang baru, dan sudah siap untuk diimplementasikan. Untuk mengklasifikasikan apakah seseorang pelanggan tergolong ke dalam churn atau tidak, digunakan teknik klasifikasi support vector machine. Penelitian yang dilakukan terbukti dapat meningkatkan performansi model prediksi yang dibangun, dengan menggunakan combine sampling dapat menghasilkan performansi f1-measure sebesar 41,9793%.
Kata kunci: churn prediction, imbalance data, support vector machine, synthetic minority oversampling technique, Neighbourhood cleaning rule, oversampling, undersampling.