Analisis dan Implementasi Metode Clustering dan Non-Negative Matrix Factorization pada Peringkasan Multi Dokumen

Arif Wibowo

Informasi Dasar

113070308
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Peringkasan teks (text summarization) adalah proses pengambilan informasi yang paling penting dari satu atau beberapa dokumen teks sehingga dihasilkan sebuah versi yang lebih ringkas dengan menggunakan aplikasi berbasis komputer.

Pada Tugas Akhir ini diimplementasikan metode clustering dan nonnegative matrix factorization(NMF) untuk meringkas multi dokumen berita. Ringkasan yang dihasilkan berupa ringkasan ekstraktif yang berisi kalimat-kalimat penting dari dokumen berita. NMF akan menguraikan kalimat menjadi kombinasi semantic feature. Hal ini dapat meningkatkan kualitas hasil ringkasan, karena dengan melihat kesamaan antara semantic feature kalimat dengan topik berita, akan diketahui kalimat yang penting dan benar-benar relevan dengan topik berita. Dalam metode peringkasan ini juga akan dilakukan proses clustering yang bertujuan untuk menghilangkan kalimat-kalimat noise dan meminimalkan redundancy pada ringkasan.

Pengevaluasian dilakukan menggunakan ROUGE evaluation toolkit. Hasil pengujian menunjukkan bahwa metode NMF dengan clustering menghasilkan ringkasan yang mempunyai nilai precision lebih tinggi dan redundancy lebih sedikit dibandingkan dengan ringkasan yang dihasilkan metode NMF tanpa clustering.Kata Kunci : peringkasan teks, nonnegative matrix factorization, clustering.ABSTRACT: The text summarization is the process of taking the most important information from a text document or some text documents to create a brief version of that text using a computer-based application.

On this final assessment implemented multi document summarization based on clustering and nonnegative matrix factorization. The summarization produce extractive summaries consist of important sentences from the documents. NMF decomposes a sentence into combination of semantic feature. It can improve the quality of document summaries, because by using similarity between semantic feature and document topic, it can produce important sentences which have high relevance with the document topic. In the proposed method there is also clustering process to remove noise sentence and redundancy.

Evaluation of the summaries uses ROUGE evaluation toolkit. The test results show that summarization using NMF and clustering can produce summaries with higher precision score than summarization using NMF without clustering. NMF with clustering also produce summaries with fewer redundancy.Keyword: text summarization, nonnegative matrix factorization, clustering.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis dan Implementasi Metode Clustering dan Non-Negative Matrix Factorization pada Peringkasan Multi Dokumen
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Arif Wibowo
Perorangan
Angelina Prima Kurniati, Shaufiah
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini