ABSTRAKSI: Data mining merupakan sebuah proses penemuan pola-pola yang menarik dari sekumpulan data berukuran besar. Dalam data mining, banyak fungsi yang bisa dilakukan. Mulai dari klasifikasi, klastering dan aturan asosiasi. Dalam kehidupan nyata, implementasi dari data mining sangat banyak. Contohnya adalah prediksi churn, prediksi kecurangan, segmentasi pelanggan dan lain-lain. Pada tugas akhir kali ini akan dibahas mengenai segmentasi pelanggan dengan menggunakan teknik klastering yang disebut BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies).
“Klastering merupakan cara untuk mengelompokkan objek-objek yang ada dalam basis data ke dalam kelas-kelas [8]”. Jadi, ini mampu menjawab kebutuhan untuk segmentasi pelanggan. Dengan segmentasi, pelanggan-pelanggan dibagi kedalam beberapa segmen, sehingga perusahaan dapat memberikan perlakuan kepada pelanggannya dengan cara yang berbeda berdasarkan segmennya. Dengan segmentasi pelanggan, basis data pemasaran yang sangat besar dapat diekstrak dengan tujuan untuk memperoleh informasi mengenai tingkah laku pelanggan dan akhirnya perusahaan dapat mengupayakan inisiatif dan strategi untuk retensi.
Metode clustering BIRCH menggunakan struktur pohon dengan tinggi tertentu untuk mengklasterkan dataset yang sangat besar. Klaster BIRCH menggunakan konsep Cluster feature (CF) yang meringkas informasi mengenai subcluster-subcluster pada pohon CF yang kemudian dikelompokkan kedalam sejumlah k-kelompok menggunakan prosedur klastering hierarki. Dari hasil analisa, didapatkan bahwa nilai threshold sebagai salah satu parameter yang diinputkan user dapat mempengaruhi kinerja perangkat lunak. Jika semakin kecil nilai threshold, jumlah subcluster yang dihasilkan semakin banyak dan waktu eksekusi meningkat. Selain itu, peningkatan jumlah data dan dimensi juga turut mempengaruhi waktu untuk preclustering dan clustering global, semakin banyak jumlah data dan jumlah dimensi maka semakin lama waktu yang dibutuhkan karena semakin banyaknya subcluster yang terbentuk.
Kata Kunci : data mining, segmentasi pelanggan ,klastering, BIRCHABSTRACT: Data mining is a process to find an interesting pattern from very large data warehouse. In data mining, many tasks can be done. Begin from classification, clustering and rule association. In reality, the implementation of data mining is very much. For examples are churn prediction, fraud detection, customer segmentation etc. This paper discuss about customer segmentation using clustering method that called BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies).
“Clustering is the task of grouping the objects of a database into meaningful subclasses. So, it can answer the need of customer segmentation [8]”. With segmentation, customers are divided into different segments, so the company can give a treat for their customers with different ways based on its segments. By customer segmentation, very large marketing database can be extracted in order to get important information about customer behavior and finally, the company can create an initiative or retention strategy.
BIRCH clustering method uses a highly specialized tree-structure for the purpose of clustering very large sets of point. Cluster BIRCH uses CF (Cluster Feature) concept which summaries the information about subclusters on CF Tree then clustered to k-groups using clustering hierarchical procedure. From the analysis, we can see that threshold as a parameter that inputed by user influences software’s performance. The smaller threshold value, the number of subcluster created is larger and need more time to executes. Beside that, the increase the number of data and dimension influence preclustering and global clustering time, more data and dimension, so more time needed to execute the program because there are more subclusters created.
Keyword: data mining, customer segmentation, clustering, BIRCH