Klasifikasi dalam Data Mining menggunakan K-Nearest Neighbor based association (KNNBA)

Arvica suchiany puspita hati

Klasifikasi dalam Data Mining menggunakan K-Nearest Neighbor based association (KNNBA)

Arvica suchiany puspita hati

Informasi Dasar

Klasifikasi dalam Data Mining menggunakan K-Nearest Neighbor based association (KNNBA)

Dilihat

368 kali

No. Katalog

113050255

Klasifikasi

005.1

Jenis katalog

Karya Ilmiah - Skripsi (S1) - Reference

Abstraksi

ABSTRAKSI: Seiring dengan perkembangan teknologi dalam hal pengumpulan dan penyimpanan data menyebabkan tumpukan data yang sangat banyak. Dengan adanya kumpulan data yang banyak, maka timbulah suatu kebutuhan untuk bisa memanfaatkan data tersebut. Pemanfaatan data tersebut tentunya bertujuan untuk mendapatkan informasi yang penting dari pola-pola data yang terbentuk. Proses untuk mendapatkan informasi atau pola-pola berharga dari sekumpulan data tersebutlah yang dinamakan Data mining. Klasifikasi merupakan salah satu metode dari data mining. Salah satu algoritma klasifikasi yang terkenal adalah K-nearest neigbor (KNN). Algoritma KNN sangatlah sederhana, bekerja berdasarkan jarak terpendek dari query instance ke training sample untuk menentukan KNN-nya dan mudah untuk di implementasikan. Salah satu masalah pada algoritma KNN adalah efek yang sama dari semua atribut dalam menghitung jarak antara dokumen yang baru dan dokumen yang tersedia dalam data training, mungkin beberapa dari atribut ada yang kurang penting untuk proses klasifikasi dan beberapa atribut lebih penting . Dalam penelitian ini akan menggunakan algoritma K-Nearest Neighbor Based Association (KNNBA) untuk mengatasi kekurangan dari KNN, dimana pada KNNBA tiap-tiap atribut diberikan bobot yang berbeda dengan menggunakan metode association rules. Pada tugas akhir menggunakan enam dataset yang memiliki karakteristik yang berbeda-beda. Dari hasil pengujian dan analisis didapat bahwa association dapat meningkatkan akurasi KNN dengan menggunakan parameter minimum support dan minimum confidence yang sesuai dengan jenis data atributnyaKata Kunci : Data mining, klasifikasi, K-nearest neigbor, K-Nearest Neighbor Based Association association rules, support, confidenceABSTRACT: The development of technology for the collection and storage of data causes the stack of data very much. Given that many data sets, creating a need to be able to utilize the data. Utilization data is of course intended to get important information from the data patterns are formed. The process to obtain information or patterns from a collection of valuable data is called data mining. Classification is one method of data mining. One well-known classification algorithms are K-nearest neigbor (kNN). KNN algorithm is very simple, works based on the shortest distance from the query instance to the training sample to determine its kNN and easy to implement. One of the problems in the kNN algorithm is the same effect of all attributes in calculating the distance between new documents and documents that are available in training data, there are probably some of the attributes that are less important to the process of classification and some attributes are more important. In this research we will use K-Nearest Neighbor Algorithm Based Association (KNNBA) to overcome the shortcomings of the kNN, where the KNNBA of each attribute are given different weights by using the method of association rules.In the final project using six datasets that have different characteristics. From the results of testing and analysis shows that the association can improve the accuracy of kNN by using the parameters of minimum support and minimum confidence appropriate to the type of data attributes.Keyword: Data mining, classification, K-nearest neigbor, K-Nearest Neighbor Based Association, association rules, support, confidence