Analisis Algoritma Generalized Incremental(GenIc) pada Pengelompokkan Dokumen Hasil Pencarian

Olifsia Anny Theresia Simamora

Informasi Dasar

113060292
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Kebanyakan search engine saat ini menggunakan sistem perengkingan pada dokumen hasil pencarian. Sehingga diperoleh begitu banyak dokumen yang sebenarnya tidak semuanya relevan menurut user. Akhirnya user harus membuka satu per satu dokumen untuk memastikan apakah dokumen tersebut yang user inginkan. Oleh karena itu pada tugas akhir ini penulis menggunakan metode clustering pada dokumen-dokumen hasil pencarian untuk mengatasi permasalahan tersebut

Metode clustering yang digunakan adalah metode Generalized Incremental(GenIc). GenIc menggunakan teknik Generalized incremental dan evolutionary dalam melakukan proses pengelompokkan dokumennya. Yang dimaksud dengan Generalized incremental adalah proses penggeseran center sehingga jarak center dengan dokumen pada cluster tersebut semakin dekat. Sedangkan, teknik evolutionary adalah proses update center dengan menghitung probabilitas tiap center sehingga dapat ditentukan mana center yang dapat “bertahan” atau “dibunuh”. Untuk menerapkan metode ini, ada beberapa parameter yang harus dimasukkan oleh user yakni jumlah cluster awal(m), jumlah cluster akhir(k), jumlah generasi(n),dan nilai δ.

Pengujian dilakukan untuk menganalisis pengaruh keempat parameter terhadap performansi waktu GenIc dan kualitas cluster yang dihasilkan. Kualitas cluster dilihat dari nilai similarity antar dokumen dalam satu cluster. Semakin tinggi nilai similaritynya maka semakin bagus kualitas cluster yang dihasilkan dan demikian sebaliknya.

Kata Kunci : clustering, algoritma GenIc, teknik evolutionary, generalized incrementalABSTRACT: Most search engines today use a system perengkingan the document search results. Thus obtained are so many documents that are not all relevant according to the user. Finally, a user must open one by one document to ascertain whether the document that the user wants. Therefore in this thesis author clustering method on the documents of search results to solve the problem.

Clustering method used is the Generalized Incremental method (GenIc). GenIc using Generalized incremental and evolutionary techniques in the process of grouping documents. The definition is a process of incremental Generalized shifted so that the distance center to center on the cluster of documents is getting closer. Meanwhile, evolutionary engineering is the process of updating center by calculating the probability of each center so that it can be determined where the center is able to "survive" or "murdered". To apply this method, there are several parameters that must be entered by the user ie the number of initial cluster (m), the final number of clusters (k), the number of generations (n), and the value of δ.

Tests conducted to analyzed the influence of four parameters on GenIc time performance and cluster quality based on hypotheses generated byRijbergen, documents relevant to a query that tend to have similarities to each other can be grouped in one same cluster.

Keyword: clustering, GenIc algorithm, evolutionary, generalized incremental.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis Algoritma Generalized Incremental(GenIc) pada Pengelompokkan Dokumen Hasil Pencarian
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Olifsia Anny Theresia Simamora
Perorangan
Yanuar Firdaus A.W., Kusuma Ayu Laksitowening
 

Penerbit

Universitas Telkom
Bandung
2010

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini