ANALISIS PERBANGAN PEMBOBOTAN KATA PERINGKAS TEKS OTOMATIS

KHAIRUL IHSAN

Informasi Dasar

113088074
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Text Summarization adalah sebuah proses untuk menghasilkan ringkasan (summary) dari suatu artikel tapi tetap memiliki gambaran yang akurat dari isi suatu artikel. Tujuannya adalah mengambil sumber informasi dengan mengutip sebagian besar isi yang penting dan menampilkan kepada pembaca dalam bentuk yang ringkas dan sesuai dengan kebutuhan pembaca.
Pada tugas akhir ini mengimplementasikan metode dengan TF-ISF (Term FrequencyInverse Sentence Frequency) [12] yaitu salah satu metode pada text summarization yang menghasilkan keluaran berupa ringkasan ekstraktif yang terdiri dari kalimat-kalimat beranking tinggi. Sebagai pembanding digunakan metode peringkasan teks dengan TF-IDF (Term FrequencyInverse Document Frequency) dengan menambahkan konsep ekstraksi frase utama (Keyphrase Extraction) [10] dari suatu teks. Hasil ringkasan yang dihasilkan tetap memiliki/ mengandung bagian-bagian yang penting dari artikel asli sehingga diharapkan dapat membantu pembaca untuk menyerap informasi yang ada dalam artikel melalui ringkasan (summary).
Hasil pengujian menunjukkan bahwa proses summary sangat bergantung pada jenis artikel/dokumen, jumlah kalimat yang dimiliki dan panjang summary yang diinginkan. Performansi dari sistem dinilai menggunakan Precision, Recall dan F-Measure menunjukkan bahwa metode TF-ISF memiliki performansi yang sama dengan TF-IDF yang digunakan pada single document, sedangkan hasil summary pada multidocument menunjukkan bahwa metode TF-IDF dengan Keyphrase Extraction memiliki performansi lebih baik daripada TF-ISF dengan Keyphrase Extraction, karena didukung oleh faktor meningkatnya nilai kemunculan term dan frase utama.
Kata Kunci : Text Summarization, Ekstraksi Frase Utama, TF-IDF, TF-ISF.ABSTRACT: Text summarization is a process to produce a summary of an article but still have an accurate description of the contents of an article. Objective of this process is to take the source of information by citing most of the important content and show it to the readers in a simple form that appropriate with reader's need.
In this final task is to implement the method of TF-ISF (Term Frequency * Inverse Sentence Frequency) [12] which is one method of text summarization that produces output in the form of extractive summaries of high rank sentences. As a comparison of TF-ISF method, used another text summarization method is TF-IDF (Term Frequency * Inverse Document Frequency) modified using keyphrase extraction[10] concept. Thus, hopefully this system can help readers to get informations from articles through a summary. Text Summarization will produce a text that still has the main points from the original articles
The test results showed that the summary process depends on the type of articles / documents, total sentences and the summary length. System’s performance results analyzed using Precision, Recall, and F-Measure showed that TF-ISF method has the same performance with the TF-IDF in processing single document. Otherwise for multidocument summary process, TF-IDF method with Keyphrase Extraction has better performance than TF-ISF method with Keyphrase Extraction, because it is supported by the increasing value of term occurrences and keyphrase.
Keyword: Text Summarization, Keyphrase Extraction, TF-IDF, TF-ISF.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

ANALISIS PERBANGAN PEMBOBOTAN KATA PERINGKAS TEKS OTOMATIS
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

KHAIRUL IHSAN
Perorangan
Hetti Hidayati, Yanuar Firdaus A.W.
 

Penerbit

Universitas Telkom
Bandung
2010

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini