Klusterisasi Dokumen Berita Berbahasa Indonesia menggunakan Document Index Graph

Sari Ernawati

Informasi Dasar

113040357
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Berita elektronik merupakan media informasi yang paling populer dan interaktif saat ini. Begitu interaktifnya, hingga perkembangannya cukup pesat. Terbukti bertambah banyaknya situs perusahaan maupun situs personal, yang berarti semakin meningkatkan jumlah informasi dan data. Peningkatan yang pesat ini juga dipacu oleh penggunaan internet yang semakin berkembang dibandingkan era sebelumnya. Sebagai akibatnya, jumlah informasi meningkat secara eksponensial.
Banyaknya data yang ada, semestinya dapat memberikan manfaat yang banyak pula. Clustering merupakan salah satu metode untuk pengelompokan dokumen dengan menemukan keterkaitan antar dokumen. Saat ini, kebanyakan metode klusterisasi hanya mengandalkan perhitungan kesamaan berdasarkan kata dan tidak memperhatikan aspek lain, misalnya kesamaan frasa, misalnya Vector Space Model. Pada tugas akhir ini berusaha mengklusterkan dokumen dengan metode Document Index Graph yang menggunakan kombinasi dua kesamaan dokumen yaitu; kesamaan berbasis kata dan kesamaan berbasis frasa.
Metode ini diuji coba dengan menggunakan sampel berita berbahasa Indonesia dari media massa berbasis web. Pemilihan similarity blend factor dan similarity threshold yang tepat akan meningkatkan kualitas kluster. Hasil klusterisasi dievaluasi berdasarkan nilai precision dan recall.
Kata Kunci : clustering, Document, Index, Graph, similarity.ABSTRACT: Nowadays, Electonic news are most popular and interactive information media. Because of that, it grows fast. It is proved by the increasing of company sites and personal sites which is mean that more information and data. This fast increasing is paced by the increasing in using internet recently than before. As the effect, the volume of informations getting bigger and increase exponentially.
The number of data should be serve many advantages. Clustering is one of method to group documents by founding the document relations. Nowadays, the clustering methods mostly rely on term based similarity but ignore another aspect , such as Vector Space Model. On this final project, documents are grouped by Document Index Graph which combine term based similarity and phrase based similarity.
This method is tested by using Indonesian news article from world wide web. An exact selected similarity blend factor and similarity threshold will improve cluster’s quality. The result of clustering will evaluate according precision and recall value.
Keyword: clustering, Document, Index , Graph, similarity.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Klusterisasi Dokumen Berita Berbahasa Indonesia menggunakan Document Index Graph
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Sari Ernawati
Perorangan
Arie Ardiyanti Suryani, Erwin Budi Setiawan
 

Penerbit

Universitas Telkom
Bandung
2009

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini