Peringkas Teks Otomatis dengan Menggunakan Stemming pada Metode Centroid-Based(CBS) Multidokumen Berita

Putra Edi Mujahid

Informasi Dasar

113070233
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Peringkas teks otomatis (automatic text summarization) merupakan proses dalam pengambilan informasi yang paling penting dari sebuah teks atau beberapa teks untuk membuat sebuah versi ringkas dari teks dengan menggunakan aplikasi berbasis komputer. Pada Tugas Akhir ini diimplementasikan centroid-based,stemming dan stopword. Centroid dari klaster merupakan sekumpulan dari term melalui proses perhitungan yang dianggap penting terhadap sebuah klaster dari dokumen-dokumen. Stemming merupakan suatu proses pembentukan kata-kata yang berimbuhan ke kata dasarnya dan stopword merupakan suatu proses penghilang kata-kata yang dianggap tidak penting yang terdapat pada stopword list. Feature ekstraksi kalimat yang digunakan adalah centroid value yaitu penjumlahan nilai-nilai centroid dari kata-kata yang terdapat dari kalimat tersebut, letak atau posisi kalimat dalam paragraph, overlap judul yaitu nilai kemiripan suatu kata dalam kalimat yang dibandingkan dengan judul dari dokumen, dan redundancy data untuk mengatasi kata yang berulang. Parameter-parameter tersebut akan dihitung untuk menentukan rangking dan kalimat, rangking yang terbesar di hasilkan akan menjadi kandidat ringkasan. Hasil dari aplikasi ini adalah ringkasan ekstraktif yang terdiri dari kalimat-kalimat dengan rangking tertinggi. Adapun pengujian nya dilakukan dengan menggunakan ROUGE evaluation toolkit. Hasil pengujian menunjukkan bahwa metode centroid-based dengan menggunakan preprocessing stemming dan stopword mempengaruhi hasil ringkasan yang dihasilkan.Kata Kunci : Peringkas teks otomatis, stemming, stopword, feature ekstraksi,centroid-based,concept,ROUGE evaluation toolkit.ABSTRACT: The automatic text summarization is the process of taking the most important information from a text or some text to create a brief version of that text to fulfill user's need or any tasks required.using a computer-based application. On this final project implemented an centroid based,stemming and stopword process. The centroid of cluster to identify the salient sentences, a centroid is a set of words that are statically important to a cluster of documents. Stemming and stopword process is also used to determine affect the accuracy of the summary. Centroid value, position value, title overlap value and redundancy penalty are the features extraction to determine the highest score among the sentences. Centroid value counts the centroid value of all words in the sentence. Similarity with tittle measured how similar the sentences with its document’s tittle. The process produces the output in the form of extractive summary that consists of high ranked sentences. Evaluation of the summaries uses ROUGE evaluation toolkit. Evaluation results show that the method centroid based using preprocessing of Stemming and stopword process affect the accuracy of the summary generated.Keyword: Text summarization, stemming, stopword, features extraction, centroid based, concept, ROUGE evaluation toolkit.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Peringkas Teks Otomatis dengan Menggunakan Stemming pada Metode Centroid-Based(CBS) Multidokumen Berita
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Putra Edi Mujahid
Perorangan
Shaufiah, Hetti Hidayati
 

Penerbit

Universitas Telkom
Bandung
2013

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini