ABSTRAKSI: Churn Prediction adalah prediksi terhadap pelanggan telekomunikasi selular yang berpotensial cabut dari perusahaan tersebut. Dalam suatu perusahan, setiap pelanggan memiliki data yang sangat besar dan terus bertambah setiap harinya. Permasalahan lainnya adalah data yang besar tersebut tidak semuanya berguna atau berpengaruh dalam memprediksi churn.
Untuk mengatasi permasalahan diatas, maka dilakukan feature selection terhadap data yang dimiliki. Feature selection yang dilakukan dengan menggunakan tools analysis dan human analysis. Untuk tools analysis menggunakan metode Fast Correlation Based Filter, Correlation Coefficient dan feature selection Clementine. Sedangkan untuk human analysis dilakukan oleh pakar yang ahli dibidangnya. Untuk proses klasifikasinya digunakan metode C5.0 yang terdapat di Clementine 10.1. Sedangkan untuk perhitungan akurasi digunakan perhitungan Gini Coefficient, Top Decile Lift dan Lift Curve.
Hasil yang didapat dari penelitian menunjukkan bahwa metode feature selection dapat meningkatkan akurasi. Untuk data perusahaan telekomunikasi, metode feature selection yang terbaik adalah dengan gabungan antara human analysis dan tools analysis. Sedangkan untuk data turnamen, metode feature selection yang terbaik adalah hanya dengan tools analysis. Human analysis akan memberikan hasil yang optimal pada data berdimensi tinggi jika jumlah human analyst-nya diperbanyak dari human analyst yang hanya menganalisis data berdimensi tinggi. Akan tetapi semakin banyak human analyst semakin besar juga biaya yang dikeluarkan perusahaan.
Kata Kunci : feature selection, churn prediction, tools analysis, human analysis.ABSTRACT: Churn prediction is a prediction to the telecommunication cellular customers that potentially churn. Another issue is that some data is not particularly useable or affecting the process in reaching the expected purposes. Because of that, to perform the mining process is impossible to use all the available features.
In order to solve it, it will perform feature selection to the available data. The feature selection will perform by using tool and human analysis. The tool analysis is using Fast Correlation Based Filter and Correlation Coefficient method also Clementine’s feature selection. Meanwhile, the human analysis is performed by the field expert. For the classification process is using C5.0 method that integrated in the Clementine 10.1. But for the accuration calculation is using Gini Coefficient, Top Decile Lift and Lift Curve calculation.
The result from this research show that feature selection method can increase accuration. For telecomunication campany data, the Based feature selection method is collaboration between human analysis and tools analysis. Meanwhile for turnament data, the best feature selection method is tools analysis. Human analysis will give the optimal result in high dimensionality data if number of human analyst more many than human analyst to low dimensionality data. But if many human analyst will analysis the data then much expense will be outputed by company.
Keyword: feature selection, churn prediction, tools analysis, human analysis.