ABSTRAKSI: Peringkasan teks otomatis (automatic text summarization) adalah proses mengambil informasi yang paling penting dari sebuah teks dokumen atau beberapa teks dokumen sehingga dihasilkan versi yang lebih singkat yang digunakan oleh user (users) untuk task tertentu (tasks) dengan memanfaatkan aplikasi berbasis komputer. Peringkasan dapat dilakukan dengan perangkingan terlebih dahulu lalu kemudian menyusun kembali menjadi sebuah ringkasan. Hasil yang didapat dari proses peringkasan belum dapat dikatakan baik dikarenakan memungkingkan adanya redundansi atau duplikasi dokumen yang termuat dalam ringkasan. Oleh karena itu, dibutuhkan suatu penanganan untuk mengurangi tingkat redundansi pada dokumen ringkasan. Penanganan tersebut adalah dengan proses reranking atau perangkingan ulang.
Pada Tugas Akhir ini diimplementasikan suatu teknik Automatic Text summarization dengan metode Maximal Marginal Relevance untuk multi dokumen berita. Aplikasi ini dilakukan terhadap multidokumen berita berbahasa Indonesia yang memiliki topik yang sama. Metode ini bersifat query-based dengan perhitungan skor kalimat dilakukan berdasarkan similarity antar kalimat dengan user query untuk menghasilkan skor tiap kalimat pada seluruh dokumen sehingga didapatkan urutan rangking seluruh kalimat. Beberapa kalimat yang memiliki rangking tertinggi akan diekstraksi menjadi kalimat ringkasan sesuai dengan parameter compression rate yang diinginkan user. Metode similarity yang digunakan yaitu cosine-based similarity. Proses ordering dilakukan agar kalimat-kalimat hasil ringkasan dapat terurut dan tidak ada redundancy data atau informasi yang berulang. Diimplementasikan pula metode modifikasi Maximal Marginal Relevance yang dalam perhitungannya melibatkan parameter penalty.
Pengujian dilakukan dengan menggunakan ROUGE evaluation toolkit dengan membandingkan hasil metode Maximal Marginal Relevance dan modifikasi Maximal Marginal Relevance. Hasil pengujian menunjukkan bahwa kedua metode yang diimplementasikan pada tugas akhir ini sudah memiliki akurasi yang cukup baik (menghasilkan ringkasan dengan redundansi minimum).Kata Kunci : peringkas teks otomatis, Maximal Marginal Relevance dan modifikasi, user query, cosine-based similarity, ordering, evaluation.ABSTRACT: The automatic text summarization is the process of taking the most important information from a text or some text to create a brief version of that text to fulfill user's need or any tasks required.using a computer-based application. One of usuall process is with ranking process on the first step, soon rearange being a summary. The result got from the process could not said as a good summary because it can be a redundancy or duplicats on the summary. Furthermore, that needs a handle to reduce redundancy on the summary’s documents. The process is reranking.
On this final assessment, the Automatic Text summarization technique with Maximal Marginal Relevance method for multi-document of news is applied. As the input for this application are Indonesia news documents which have same topic. This method is query-based with the calculation of sentence score is based on similarity sentences with query to yield the score of every sentence to get sequence ranking of all sentence. Some sentences which have highest ranking will be extracted to be a summary as according to parameter of compression rate from user. Similarity method that is used is cosine-based similarity. Ordering process are apllied to produce a summary which has chronological in meaning yet and there are no redundancy data or repeated information. Also implemented the Maximal Marginal Relevance modification with adding the number of penalty on the calculation.
Evaluation of the summaries uses ROUGE evaluation toolkit comparing the result of Maximal Marginal Relevance and Maximal Marginal Relevance modification. Result of examination indicate that both of these method application in this final assessment have owned the good enough accuration (produce summary with minimum redundancy).Keyword: automatic text summarization, Maximal Marginal Relevance and modification, user query, cosine-based similarity, ordering, evaluation.