ABSTRAKSI: Peringkasan teks otomatis (automatic text summarization) adalah proses mengambil informasi yang paling penting dari sebuah teks atau beberapa teks untuk membuat sebuah versi ringkas dari teks dengan menggunakan aplikasi berbasis komputer
Pada Tugas Akhir ini diimplementasikan suatu teknik Automatic Text summarization berdasarkan pendekatan Graf untuk multi dokumen berita. Proses ini menghasilkan keluaran berupa ringkasan ekstraktif yang terdiri dari kalimat-kalimat. Metode perankingan berbasis graf yang diterapkan adalah LexRank[6] yang akan merangking kalimat dari multi dokumen yang digunakan, dengan menghitung nilai centrality suatu kalimat, rangking kalimat tertinggi kemudian akan di ekstrak menjadi ringkasan. Adapun metode centrality yang digunakan pada tugas akhir ini adalah metode degree centrality yang merupakan adaptasi langsung dari LexRank dan metode modified LexRank centrality, yang merupakan modifikasi LexRank dengan ide dasar PageRank. Perhitungan Kedua metode tersebut ditentukan oleh perhitungan similarity antar kalimat, metode similarity yang digunakan pada tugas akhir ini, yaitu metode idf modified cosine similarity, yang merupakan bawaan langsung dari LexRank, dan metode Long Common Subsequences similarity yang merupakan modifikasi untuk melihat similarity antar kalimat berdasarkan makna. Selanjutnya hasil ringkasan yang didapat belum terurut untuk itu di perlukan proses ordering. Ordering yang akan digunakan adalah metode chronological ordering. Permasalahan suatu peringkasan multi dokumen adalah terdapatnya redundancy data atau informasi yang berulang untuk menghilangkannya di lakukan proses Reranker.
Pengevaluasian dilakukan menggunakan ROUGE evaluation toolkit. “Hasil pengujian menunjukkan metode degree centrality dengan idf modified cosine similarity memiliki akurasi lebih baik dibandingkan ke tiga metode lainnya yang diimplementasikan pada Tugas Akhir ini” .Kata Kunci : peringkasan teks, LexRank, Degree centrality, Modified LexRank centrality, idf modified cosine similarity, Long common subsequences similarity, Reranker, chronological ordering.ABSTRACT: The automatic text summarization is the process of taking the most important information from a text or some text to create a brief version of that text using a computer-based application.
On this final assessment the Automatic Text summarization technique based on Graph approach for multi-document news is implemented. This process produces an output in the form of extractive summary which is consist of sentences. The ranking grades method based on graph which is applied is LexRank, which will arrange grades in a rank of a sentence from multi documents that are used by calculate the centrality value based on the concept of Similarity, the highest ranking then will be extracted to be a summary. The centrality methods that are used on this final assessment are degree centrality which is a direct adaptation from LexRank and modified LexRank centrality method which is a direct modification of LexRank with PageRank as the basic idea. The calculation on both methods are by the similarity calculation between sentences. Similarity methods that are used on this final assessment are idf modified cosine similarity method which is also a direct adaptation from LexRank, and Long Common Subsequences similarity method that is a modification to observe similarity between sentences based on sentences meaning. The summary results which is extracted are not chronological in meaning yet, because of that it needs the ordering process. Ordering will be used is a method of chronological ordering. The problem of a multi documents summarization there is a redundancy of data or repeated information to removed it have to do a Reranker process.
The evaluation has to do by ROUGE evaluation toolkit. "The test results show method of degree centrality with idf modified cosine similarity has the best accuracy from the other method,that have been implemented on this last task.".Keyword: automatic text summarization, LexRank, Degree centrality, Modified LexRank centrality, idf modified cosine similarity, Long common subsequences similarity, Reranker, chronological ordering.