Modified Random Forest For Handling Imbalanced Class in Customer Churn Prediction (Case Study: Telecommunication Industry)

ZAHRA PUTRI AGUSTA

Informasi Dasar

64 kali
18.05.006
C
Karya Ilmiah - Thesis (S2) - Reference

Perkembangan industri telekomunikasi saat ini ,menghasilkan persaingan yang sangat ketat antara penyedia layanan (service provider). Persaingan ini mengakibatkan Customer Churn menjadi salah satu permasalahan yang sering dihadapi, karena dapat mempengaruhi pendapatan perusahaan, profitabilitas, kelangsungan hidup serta kualitas pelayanan perusahaan . Oleh karena itu, mengetahui pelanggan yang akan melakukan churn dikemudian hari (Customer churn prediction) secara dini menjadi salah satu cara yang sering dilakukan, karena dapat membantu perusahaan dalam membuat rencana yang efektif untuk tetap mempertahankan pelanggannya. Teknik klasifikasi data mining dapat digunakan untuk customer churn prediksi. Random forest merupakan salah satu teknik klasifikasi yang dikenal memiki kinerja sangat baik jika dibandingkan dengan teknik klasifikasi lainnya, karena sangat mudah digunakan dan memberikan performansi akurasi yang lebih tinggi. Namun algoritma klasifikasi tidak dapat berjalan dengan baik jika dihadapkan pada data yang tidak seimbang karena dapat mempengaruhi kinerja teknik klasifikasi serta performansi yang dihasilkan. Sedangkan data Customer Churn salah satu data yang memiliki karakteristik data yang tidak seimbang, dimana memiliki salah satu class data yang sedikit dari pada class data lainnya. Tujuan dari penelitian ini adalah menanggani data imbalance pada Customer Churn Prediction untuk meningkatkan efektivitas teknik klasifikasi dalam menghasilkan performansi prediksi yang lebih baik. Oleh karena itu dalam penelitian ini dilakukan klasifikasi pada data Customer churn PT Telekomunikasi Indonesia dengan mengusulkan sebuah metode yang dinamakan Modified Balance Random Forest (MBRF). Proses MBRF melakukan perubahan proses Balance Random Forest dengan menerapkan strategi undersampling berdasarkan clustering untuk setiap boostrap data yang akan dijadikan dalam pembentukan setiap pohon keputusan pada random forest, oleh sebab itu pendekatan MBRF disebut juga pendekatan handling imbalance data berdasarkan algoritma. Metode yang diuslkan pada penelitian ini (MBRF) memberikan hasil performansi yang lebih baik jika dibandingkan dengan metode Balance Random Forest (BRF) dan Random Forest (RF). MBRF memberikan nilai akurasi AUC terbaik (91.65%), Sensitivity atau True Positve Rate (TPR) terbaik (88%), Specificity atau True Negative Rate (TNR) terbaik (94%), dan G-Means terabaik (91%). Selain memberikan performansi yang lebih baik, MBRF juga memperbaiki jumlah waktu running time dengan menghasilkan time consumption proses yang lebih rendah.

Subjek

DATA ANALYSIS
 

Katalog

Modified Random Forest For Handling Imbalanced Class in Customer Churn Prediction (Case Study: Telecommunication Industry)
 
 
Inggris

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

ZAHRA PUTRI AGUSTA
Perorangan
ADIWIJAYA
 

Penerbit

Universitas Telkom, S2 Teknik Informatika
Bandung
2018

Koleksi

Kompetensi

  • CSH5D3 - ANALISIS BIG DATA
  • CSG5G3 - DATA MINING LANJUT
  • CSH6F3 - INTELLIGENT BIG DATA MINING
  • IF5543 - PENGGALIAN DATA LANJUT
  • IF5642 - PENGGALIAN DATA TERAPAN
  • CSH6E3 - STATISTICAL BIG DATA MINING
  • CSG653 - TOPIK KHUSUS DALAM PENAMBANGAN DATA LANJUT B
  • CII6F3 - ANALISIS BIG DATA
  • CII6F3 - ANALISIS BIG DATA

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini