Peringkasan Teks Otomatis Dokumen Tunggal Berbahasa Indonesia Menggunakan Graph-based Summarization Algorithm dan Similarity (Studi Kasus Artikel Berita)

Nurzaitun Purwasih

Informasi Dasar

228 kali
113050225
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Peringkasan teks otomatis (automatic text summarization) adalah proses menyaring informasi paling penting dari sebuah sumber atau beberapa sumber untuk membuat sebuah versi ringkas dari teks dengan memanfaatkan aplikasi yang dijalankan pada komputer.
Pada Tugas Akhir ini diimplementasikan graph-based summarization algorithm dan similarity yang mengambil konsep perankingan graf untuk melakukan perankingan kalimat. Proses ini menghasilkan keluaran berupa ringkasan ekstraktif yang terdiri dari kalimat-kalimat beranking tinggi. Metode perankingan berbasis graf yang diterapkan adalah TextRank, serta dua metode lain yang menggabungkan konsep TextRank dengan konsep kemiripan dengan judul, yaitu modified TextRank dan penggabungan linear TextRank dengan similarity with title.
Pengujian dilakukan menggunakan ROUGE evaluation toolkit. Hasil pengujian menunjukkan modified TextRank dan penggabungan linear TextRank dengan similarity with title memiliki akurasi lebih baik daripada TextRank. Metode penggabungan linear TextRank dan similarity with title menunjukkan akurasi terbaik. Selain itu, hasil pengujian menunjukkan eliminasi stopwords sebagai penambahan pengetahuan kebahasaan tidak selalu meningkatkan akurasi hasil peringkasan.
Kata Kunci : peringkasan teks, TextRank, modified TextRank, similarity with title, stopwordsABSTRACT: Automatic text summarization is a computerized process of distilling the most important information of a source (or sources) for making a brief version of text(s).
This final assignment implements graph-based summarization algorithm and similarity applying graph-based ranking concept for sentences ranking. The process produces the output in the form of extractive summary that consists of high ranked sentences. Graph-based method applied is TextRank, and two other methods which combine the TextRank concept and similarity with title concept, modified TextRank and linear combination of TextRank and similarity with title.
Evaluation of summaries uses ROUGE evaluation toolkit. The result of experiment shows accuracy of modified TextRank and linear combination of TextRank and similarity with title is better than TextRank. Linear combination of TextRank and similarity with title shows the best accuracy. Besides that, stopwords elimination as a language knowledge to the method does not always improve accuracy of summaries.Keyword: automatic text summarization, TextRank, modified TextRank, similarity with title, stopwords

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Peringkasan Teks Otomatis Dokumen Tunggal Berbahasa Indonesia Menggunakan Graph-based Summarization Algorithm dan Similarity (Studi Kasus Artikel Berita)
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Nurzaitun Purwasih
Perorangan
Moch. Arif Bijaksana, Bowo Prasetyo
 

Penerbit

Universitas Telkom
Bandung
2009

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini