Implementasi dan Analisis Optimasi Clustering Hasil Pencarian Web Menggunakan Algoritma Simulated Annealing<br>Implementation and Analysis Optimization Web Search Result Clustering Using Simulated Annealing Algorithm

DIAH PURWITASARI

Informasi Dasar

113061026
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Dalam pengelompokkan (clustering) hasil pencarian, masih terdapat kendala yang sering dihadapi yaitu menentukan formulasi clustering yang tepat. Hal ini diakibatkan hubungan antar objek sangatlah bervariasi. Penentuan clustering yang salah dapat mengakibatkan performansi pencarian web yang buruk. Oleh karena itu diperlukan suatu metode clustering dimana akan menghasilkan suatu cluster yang optimal. Optimal ini dilihat tidak hanya memiliki kemiripan dokumen dalam satu cluster, tetapi juga memiliki struktur data yang mirip dengan „true cluster‟.

Proses optimasi pada clustering merupakan sebuah proses yang bertujuan untuk mencari nilai minimum global, dimana minimum global ini merupakan nilai kemiripan dokumen dalam setiap cluster. Maka diperlukan sebuah algoritma clustering yang didasarkan pada cost function optimization. Salah satu algoritma yang dapat menyelesaikan masalah pencarian minimum global ini adalah algoritma Simulated Annealing.

Pada Tugas Akhir ini akan diimplementasikan optimasi clustering menggunakan Algoritma Simulated Annealing. Dalam proses optimasi menggunakan Simulated Annealing ini menggunakan Algoritma K-Means sebagai solusi cluster awal. Penentuan Algoritma K-Means dikarenakan algoritma Simulated Annealing lebih baik diimplementasikan pada partitional clustering.

Pengujian pada proses dalam proses optimasi clustering ini dilakukan untuk mengetahui peningkatan kualitas cluster yang dihasilkan oleh Algoritma Simulated Annealing bila dibandingkan dengan cluster awal (Algoritma K-Means). Selain itu juga diuji pengaruh setiap parameter input terhadap hasil kualitas cluster. Hasil kualitas cluster ditunjukkan dengan nilai Jaccard Criterion

Hasil optimasi clustering dengan Algoritma Simulated Annealing ini menunjukkan bahwa nilai Jaccard Criterion cluster setelah proses optimasi menggunakan Algoritma Simulated Annealing, lebih baik dibandingkan dengan cluster sebelum mengalami proses optimasi. Jumlah dokumen pada data uji ikut mempengaruhi nilai kualitas hasil cluster. Selain itu parameter-parameter input (Tf, T0, MaxIt, α) juga sangat berpengaruh terhadap nilai kualitas clustering.Kata Kunci : Klasterisasi dokumen, Algoritma Simulated Annealing, Algoritma K-Means, Jaccard CriterionABSTRACT: In the grouping (clustering) results, there are still obstacles often faced is determining the proper formulation of clustering. This is due to relationships between objects are highly variable. Determination of clustering is wrong can lead to poor performance of web search. Therefore we need a clustering method which will produce an optimal cluster. Optimal is viewed not only have similar documents in one cluster, but also has a data structure similar to the 'true cluster'.

Process optimization in clustering is a process that aims to find the global minimum value, where the global minimum is a similarity value of documents in each cluster. It needs a clustering algorithm based on cost function optimization. One algorithm that can solve the problem of finding the global minimum is Simulated Annealing.

In this final project will be implemented clustering optimization using Simulated Annealing Algorithm. In the process of optimization using Simulated Annealing uses K-Means algorithm as an initial cluster solution. Determination of K-Means Algorithm Simulated Annealing due to better implemented in partitional clustering.

Tests on the clustering process in the optimization process is carried out to improve the quality of clusters generated by Algorithm Simulated Annealing when compared with the initial cluster (K-Means algorithm). It also tested the influence of each input parameter on the results of cluster quality. The result of cluster quality indicated by the value of Jaccard Criterion.

The result of clustering optimization with Simulated Annealing Algorithm is shown that the value of Jaccard Criterion cluster after process optimization using Simulated Annealing Algorithm, better than the cluster before undergoing a process of optimization. The number of documents on the test data also influences the quality of the cluster. In addition, input parameters (Tf, T0, MaxIt, α) is also great influence on the quality of clustering.Keyword: Document clustering, Simulated Annealing Algorithm, K-Means Algorithm, Jaccard Criterion

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Implementasi dan Analisis Optimasi Clustering Hasil Pencarian Web Menggunakan Algoritma Simulated Annealing
Implementation and Analysis Optimization Web Search Result Clustering Using Simulated Annealing Algorithm
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

DIAH PURWITASARI
Perorangan
Yanuar Firdaus A.W., Warih Maharani
 

Penerbit

Universitas Telkom
Bandung
2010

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini