ABSTRAKSI: Perkembangan dunia industri dan informasi secara tidak langsung
menyebabkan semakin banyaknya data yang telah dikumpulkan. Data tersebut
sebenarnya masih bisa dimanfaatkan. Salah satu cara untuk mengekstrak pola
yang penting atau menarik dari sejumlah data yang sangat besar untuk
menghasilkan informasi yang lebih berguna adalah dengan menggunakan data
mining.
Salah satu metoda pada data mining adalah classification yaitu proses
untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep
atau kelas data, dengan tujuan untuk memperkirakan kelas dari suatu objek yang
labelnya tidak diketahui
Pada Tugas Akhir ini membahas salah satu algoritma pada decision tree
yaitu Classification & Regresion Tree (C&RT atau CART) dan kemudian
menganalisa performansinya. Algoritma C&RT memiliki karakteristik khusus
yaitu selalu melakukan splitting terhadap parent node menjadi dua buah child
node. Pengimplementasiannya dibantu dengan tools Clementine dan akan
dibangun juga interface yang terintegrasi dengan tools Clementine, sehingga user
mudah untuk melakukan dan melihat hasil klasifikasi.
Dari pengujian penggunaan algoritma C&RT yang telah dilakukan,
didapatkan bahwa tingkat keakurasian sangat ditentukan oleh pemilihan data yang
digunakan pada saat training dimana nantinya akan sangat menentukan rule untuk
testing.Kata Kunci : Data mining, Classification, Clementine, decision tree, C&RT, CART.ABSTRACT: Industry and information development undirectly causing big amount of data
has been collect. Actually, those data still useful for us. One way to extract
important or interesting pattern from big amount of data to find more useful
information is by using data mining.
One of technique in data mining is classification which is a process to find a
model or function which explain a concept or class data in order to predict class
from unlabel object .
In this final project we discuss about Classification & Regresion Tree (C&RT
or CART), one algorithm of decision tree method and analyze it’s performance of
accuracy. C&RT algorithm has special characteristic like always splitting one
parent node into two child node. The implementation using Clementine tools and
later we develop some interface that integrate with Clementine tools, hopefully
can help user to make and discover the classification result.
Testing result showed that applying decision tree method with C&RT
algorithm has an accuration of the tree truth value are which depend on training
data that used to build the tree and it decide the rule on testing process.Keyword: Data mining, Classification, Clementine, decision tree, C&RT, CART