ABSTRAKSI: Recommender system berbasis collaborative filtering merupakan suatu sistem yang dapat memberikan rekomendasi berupa prediksi rating terhadap suatu item berdasarkan persamaan karakteristik atau kecendurangan user dalam merating suatu item. Sistem ini telah banyak digunakan baik oleh perusaan atau non-profit organisasi. Sehingga, diperlukan recommender system yang dapat menangani data dalam skala besar. ClustKNN merupakan algoritma yang sederhana dan intuitive yang cukup cocok untuk menangani dataset yang besar, dengan waktu prediksi yang relative lebih cepat dari pada user-based KNN biasa. Tugas akhir ini menganalisis akurasi prediksi rating dan waktu prediksi yang dihasilkan oleh recommender system setelah diimplementasikan algoritma ClustKNN dan user-based KNN. Parameter yang digunakan dalam analisis adalah perbandingan training set dengan test set, jumlah cluster, serta ukuran neighbor. Pada algoritma ClustKNN, kecendurangan active user dan kecendurangan user lain dalam merating suatu item sangat menentukan hasil prediksi rating. Akurasi prediksi yang dihasilkan oleh algoritma ClustKNN dan user-based KNN akan semakin meningkat dengan bertambahnya jumlah data yang terdapat pada training set, selain itu banyaknya jumlah cluster dan ukuran neighbor juga sangat berpengaruh, semakin banyak jumlah cluster dan besar ukuran neighbor maka akurasi akan semakin baik.
Kata Kunci : recommender system, user-based collaborative filtering, algoritma ClustKNN, algoritma user-based KNN.ABSTRACT: Collaborative filtering-based Recommender system is a system that can give a recommendation in term of rating prediction of an item, based on the similarity of user characteristic or user preference in rating an item. This system has widely used by companies or non-profit organization. Thus, the sheer number of user demands collaborative filtering – based recommender system that can gracefully cope with the vast size of the data. In this thesis, we implement and analyze the user-based collaborative filtering recommender system which applies ClustKNN algorithm and user-based algorithm as comparator. ClustKNN is a simple and intuitive algorithm that is well suited for large data sets which resulting better time prediction than user-based KNN. Then, the analysis is carried out to the accuracy of rating prediction result that is given by the recommender system. Comparison parameter on training set and set test, number of cluster, and neighbor size is used in the analysis. In ClustKNN algorithm, users’ preference very extremely determine the result of predicted ratings. The accuracy of prediction, which is resulted by ClustKNN algorithm, increases with the increase of the number of data in the training set, number of cluster, and neighbor size
Keyword: recommender system, user-based collaborative filtering, ClustKNN algorithm, user-based KNN.