ABSTRAKSI: Text mining dapat didefinisikan sebagai suatu proses menggali informasi dimana seorang user berinteraksi dengan sekumpulan dokumen menggunakan tools analisis yang merupakan komponen-komponen dalam data mining.
Salah satu task yang penting dalam text mining adalah clustering. Clustering adalah proses mempartisi sekumpulan objek ke dalam cluster-cluster. Objek-objek yang mirip akan ditempatkan dalam cluster yang sama dan cluster yang berbeda akan ditempatkan dalam cluster yang berbeda.
Tugas akhir ini mengelompokkan dokumen dengan menggunakan agglomerative nesting (AGNES). Dokumen yang digunakan adalah dokumen berita berbahasa Indonesia, sebab kebutuhan masyarakat di tanah air akan informasi semakin meningkat. Adapun keterkaitan antar berita ini diukur berdasarkan kemiripan antar dokumen. Kemiripan antar berita dihitung dari frekuensi kemunculan kata pada dokumen dengan menggunakan cosine similarity.
Setelah dilakukan pengujian dengan beberapa min Similarity, hasil uji menunjukkan bahwa agglomerative nesting dapat digunakan untuk mengelompokkan berita berbahasa Indonesia. Ini terlihat dari hasil rata-rata f-measure yang dihasilkan sekitar 97.4%.
Kata Kunci : Kata kunci : Text mining, clustering, agglomerative nesting, minSimilarityABSTRACT: Text mining can be defined as a process of information gathering in which a user interacts with a set of documents using the tools of analysis are the components of data mining.
One important task in text mining is clustering. Clustering is the process of partitioning a set of objects into clusters. Similar objects will be placed in the same cluster and different clusters will be placed in different clusters.
This final task attempt to classify documents using agglomerative nesting (AGNES). The document is a document used in Indonesian language news, because the needs of information are increase.The linkages between the news is measured based on the similarity between documents. The similarities between the news is calculated from the frequency of occurrence of words in the document using the cosine similarity.
After the testing with several min Similarity, the results shows that agglomerative nesting can be used to group Indonesian news. This is evident from the results of the average f-measure generated approximately 97.4%.
Keyword: Text mining, clustering, agglomerative nesting, minSimilarity