ABSTRAKSI: Tugas Akhir ini mendeskripsikan laporan uji coba penerapan Algoritma Divisive Information-Theoretic Feature Clustering pada data training yang akan digunakan saat klasifikasi dokumen teks. Hasil dari clustering adalah kata-kata yang akan digunakan sebagai deskripsi awal data training klasifikasi dokumen teks menggunakan metode Naïve Bayes. Pengujian pada proses clustering pada data training untuk mengetahui akurasi yang diberikan algoritma ini sebagai deskripsi awal pada klasifikasi dokumen teks. Selain itu, dilakukan pengujian pengaruh setiap parameter input terhadap hasil akurasi klasifikasi. Kualitas dari hasil klasifikasi dilihat dari hasil akurasi yang dilihat dari nilai precision, recall, dan F-Measure. Hasil klasifikasi dokumen teks menggunakan metode Naïve Bayes dimana pada data training dilakukan proses clustering menggunakan Algoritma Divisive Information-Theoretic Feature Clustering dipengaruhi oleh jumlah cluster yang diinginkan jumlah dokumen yang digunakan. Dimana nilai akurasi dari hasil klasifikasi melakukan clustering terlebih dahulu pada data training lebih baik dibandingkan tanpa melakukan clustering terlebih dahulu.
Kata Kunci : Klasifikasi dokumen teks, Clustering, data training, Naïve Bayes, Algoritma Divisive Information-Theoretic Feature Clustering, precision, recall, F-MeasureABSTRACT: This Final Project describes implementation of Divisive Information Theoretic-Feature Clustering Algorithm on data training to be used when the classification of text documents. Results of clustering are the words that will be used as the initial description text document classification data training using Naïve Bayes method. Tests on the process of clustering on data training to determine the accuracy of this algorithmis give an initial description of the classification of text documents. In addition, testing the influence of each input parameter on the results of classification accuracy. The quality of the results seen from the results of classification accuracy is seen from the value of precision, recall, and F-Measure. The results of the classification of text documents using Naïve Bayes method where data training performed clustering process using Divisive Information-Theoretic Feature Clustering Algorithm is influenced by the number of clusters desired number of documents used. Where the accuraty of the classification result with clustering first on data training perform better compared without clustering.
Keyword: Classification of test documents, Clustering, data training, Naïve Bayes, Divisive Information-Theoretic Feature Clustering Algorithm, precision, recall, F-Measure