ABSTRAKSI: Churn prediction adalah suatu cara untuk memprediksi pelanggan yang berpotensial untuk churn. Data mining khususnya klasifikasi tampaknya dapat menjadi salah satu alternatif solusi dalam membuat model churn prediction yang akurat Data yang dipakai dalam churn prediction bersifat imbalance. Kelas data akan lebih condong ke bagian data yang memiliki komposisi data yang lebih besar.
Salah satu cara untuk menangani permasalahan ini adalah dengan menggunakan metode klasifikasi Logistic Regression. Metode LR ini merupakan teknik klasifikasi biner untuk memaksimalkan fungsi probabilitas dalam pencocokan terhadap data yang akan diolah.
Analisis yang dilakukan pada tugas akhir ini adalah melakukan penseleksian atribut dari data yang ada. Kemudian hasil ini yang akan diolah oleh metode LR dan digunakan untuk mendapatkan akurasi prediksi data churn dengan melakukan penghitungan akurasi model churn prediction yang dinyatakan dalam bentuk lift curve, top decile dan gini coefficient serta f-measure untuk penghitungan akurasi prediksi data pada data yang imbalance.
Hasi dari penelitian ini menunjukkan bahwa metode LR dapat meningkatkan nilai akurasi dalam evaluasi data churn walau prediksi kelas imbalancenya kurang baik.
Kata Kunci : churn prediction, data mining, imbalance, logistic regression.ABSTRACT: Churn prediction is a method to predict behaviour of customers who is potentially for being churn. Data mining especially classification is expected to be one of alternative solution to build an accurate churn prediction model. Data of churn has an imbalance characteristic. The data class will be inclined to part of data which has greater composition side.
One method to handle this problem is a classification method, Logistic regression. Logistic Regression method, a binary classification technique, maximizes probability function in the data.
The analysis in this final task is doing the attribute selection from the data. Then, this result will be processed by LR method and used to obtain the accuration of churn prediction by counting lift curve, top decile, and gini coefficient and also f-measure as accuration of imbalance case.
The result from this research shows that LR method can increase accuration in churn evaluation although the imbalance prediction is not good.Keyword: churn prediction, data mining, imbalance, logistic regression.