Akan dibangun sebuah kamus(wordnet) yang merupakan lexical database bahasa Indonesia. Synset merupakan bagian yang dibentuk pada tahap awal pembangunan lexical database. Pembangunan yang penulis kerjakan ini pada tahap kedua yaitu menggabungkan beberapa synset yang dipandang mirip.
Synset hasil ekstraksi Tesaurus Bahsa Indonesia akan digabungkan berdasarkan nilai similarity dan distance value. Hierarchical clustering sendiri adalah metode yang mengadaptasi teknik clustering. Alasan menggunakan teknik ini karena kesederhanaan dari teknik itu sendiri dan hasil dari kelompok bisa tidak diprediksi sebelum proses pengelompokkan dilakukan.
Hasil utama dari tugas akhir ini adalah kumpulan synonym set yang sudah tercluster sesuai kemiripanya dan sudah dihitung nilai akurasinya. Nilai perhitungan akurasi yang didapat yaitu sebesar 69,88%.
Kata kunci: Wordnet, Hierarchical clustering, Tesaurus Bahasa Indonesia , Synset.