Analisis Dan Implementasi Ensemble of Support Vector Machine Pada Kasus Churn Prediction Pelanggan Telekomunikasi

Fernandy Marbun

Informasi Dasar

113068022
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Churn prediction pada pelanggan telekomunikasi merupakan upaya memprediksi/mengklasifikasi pelanggan jasa telekomunikasi yang berhenti atau berpindah berlangganan dari suatu operator ke operator yang lain. Namun dataset pada kasus churn ini biasanya memiliki kelas yang imbalance dimana jumlah instance suatu kelas (kelas active atau tidak churn atau mayor atau negatif) jauh lebih besar dari jumlah kelas yang lain (kelas churn atau minor atau positif). Akibatnya, kebanyakan classifier cenderung memprediksi kelas mayor dan mengabaikan kelas minor sehingga akurasi kelas minor sangat kecil.
Salah satu pendekatan yang dilakukan untuk menangani permasalahan ini adalah dengan memodifikasi distribusi instances dari dataset yang digunakan atau yang lebih dikenal dengan pendekatan sampling-based. Teknik resampling ini meliputi over-sampling, under-sampling, dan combine-sampling.
Dengan metode Ensemble of SVM (EnSVM) diharapkan dapat meminimalisir kesalahan klasifikasi kelas mayor dan minor yang dihasilkan oleh classifier SVM tunggal. Metode ini menggunakan teknik Combined Sampling untuk menurunkan kekuatan dari kedua teknik resampling (SMOTE dan under-samping) sehingga meningkatkan akurasi kelas minor dan mayor.
Hasil penelitian menunjukkan bahwa metode CombinedSampling-EnSVM secara umum hanya mampu menghasilkan performansi Gini Index yang lebih baik daripada metode SMOTE-SVM dan tanpa resampling (pure-SVM) pada kasus Data Telekomunikasi.Kata Kunci : churn prediction, imbalance, combined sampling, ensemble, SVM, performansi.ABSTRACT: Churn prediction on telecommunication customer case is an effort to predict/classify telecommunication service customers who quit or switch their subscribe from one operator to another. However, the dataset on its case generally have imbalanced class which instances from one class (active or negatif or majority class) have a greater number from the other (churn or positive or minority class). As a consequence, mostly classifier skewed to classify the mayority class and neglect the minority class, so that its accuracy become very low.
One approach for addressing the problem is modifying the dataset instances distribution which known as sampling-based approach. The resampling technique including over-sampling, under-sampling and combine-sampling.
With Ensemble of SVM (EnSVM) method hopefully can minimalize the majority and minority class misclassification which provided by just one classifier (SVM). It uses Combined Sampling technique to inherit the strength of both resampling technique (SMOTE and under-sampling) thus increases majority and minority class accuracy.
Through the empirical study, the result show that CombinedSampling-SVM method only can provide Gini Index performance better than SMOTE-SVM and pure-SVM method on Telecommunication Data generally.Keyword: churn prediction, imbalance, combined sampling, ensemble, SVM, performance.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis Dan Implementasi Ensemble of Support Vector Machine Pada Kasus Churn Prediction Pelanggan Telekomunikasi
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Fernandy Marbun
Perorangan
Z.K. Abdurahman Baizal, Moch Arif Bijaksana
 

Penerbit

Universitas Telkom
Bandung
2009

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini