ABSTRAKSI: Data mining merupakan proses semi-otomatis untuk pengekplorasian dan penganalisaan data yang berjumlah besar gunanya untuk mendapatkan pola yang berguna. Data mining ini merupakan proses gabungan antar bidang-bidang terutama adalah machine learning, analisis statistik dan basis data. Data mining berusaha untuk menemukan kaidah dan pola dari data.
Salah satu task yang penting dalam data mining adalah classification (klasifikasi). Klasifikasi ini dapat dideskripsikan sebagai berikut: terdiri dari data input yang disebut juga sebagai training set terdiri dari sejumlah examples (record) yang masing-masing memilki sejumlah atribut atau disebut juga fitur. Adapun tujuan klasifikasi ini adalah untuk menganalisa data input dan mengembangkan sebuah model yang akurat untuk setiap kelas berdasarkan beberapa variabel prediktor.
Melalui tugas akhir ini penulis akan mencoba mengimplementasikan sebuah algoritma berdasarkan decision tree classifier (pohon keputusan pengklasifikasi) yang melakukan fungsi klasifikasi pada data mining yakni algoritma SLIQ (Supervised Learning In Quest).
SLIQ adalah algoritma klasifikasi berdasarkan pohon keputusan yang dapat menangani atribut numerik maupun kategoris. SLIQ menggunakan kombinasi teknik pre-sorting pada fase pembangunan pohon, prosedur pengurutan yang terintegrasi dengan strategi pembuatan pohon breadth-first dan algoritma pruning-tree (pemotong pohon) baru berdasarkan prinsip Minimum Description Length (MDL). Kombinasi beberapa teknik ini menjadikan SLIQ sebuah algoritma yang dapat menangani data dalam ukuran besar sehingga penulis tertarik untuk mengangkatnya dalam tugas akhir ini.Kata Kunci : data mining, klasifikasi, SLIQABSTRACT: Data mining is a semi-otomatic exploration dan analyzing large size of data to get meaning pattern. Data mining is a combine process between majors especially machine learning, statistic analytical and database. Data mining try to find rules and pattern form data.
One of important task in data mining is classification.Classification can be described as follows. The input data, also called the training set, consists of multiple examples (records), each having multiple attributes or features. Additionally, each example is tagged with a special class label. The objective of classification is to analyze the input data and to develop an accurate description or model for each class using the features present in the data.
Through this final project writer would like to implement an algorithm based on decision tree classifier to do classification task of data mining. The algorithm is SLIQ (Supervised Learning In Quest).
SLIQ is classifier algorithm based on decision tree that can handle both numerical and categorical attributes. SLIQ use combine of pre-sorting technique at tree-growth phase, sorting procedure that integrated with breadth-first- growing strategy and new pruning-tree algorithm based on Minimum Description Length(MDL) principle. Combination of this technique make SLIQ as an algorithm that can handle large size of data interesting writer to bring this topic to her final project.Keyword: Data mining, Classification, SLIQ