Analisis Penggunaan Hybrid Statistik dan Grammar Hidden Markov Model

Abdul Ahkam

Informasi Dasar

113080069
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Information overloaded adalah sebuah istilah yang populer digunakan dalam menggambarkan kesulitan dalam memahami suatu isu dan dalam membuat keputusan, dikarenakan terlalu banyaknya informasi yang diperoleh. Peringkasan artikel merupakan salah satu solusi untuk mengatasi permasalahan information overloaded ini. Peringkasan artikel dapat dipandang sebagai penerjemahan dari “bahasa” yang memiliki kalimat panjang, kepada “bahasa” yang memiliki kalimat yang lebih pendek. Peringkasan dengan gaya extraction summary yaitu gaya peringkasan yang menggunakan kembali kata – kata yang ada pada artikel asli, kemudian mengecilkan porsinya dengan menghapus kata – kata yang tidak penting menjadi salah satu gaya peringkasan yang biasa digunakan peneliti untuk peringkasan artikel. Hybrid Statistik dan Grammar Hidden Markov Model akan diimplementasikan pada peringkasan dengan gaya Extraction Summary, yaitu dengan menghitung bobot dari keterhubungan antar katanya dan keterhubungan antar POS tagging-nya pada fase evaluation. Selanjutnya pada fase decoding, peringkasan dilakukan dengan memilih jalur state maksimum dari kumpulan kata yang memiliki bobot keterhubungan dari fase evaluation. Terakhir, dengan menggunakan ROUGE-2 yaitu dengan membandingkan antara jumlah bigram yang sama pada hasil peringkasan otomatis dengan peringkasan oleh manusia dibagi dengan jumlah bigram yang ada kita mendapatkan akurasi dari peringkasan artikel.Kata Kunci : information overloaded, peringkasan, extraction summary, Hidden Markov Model, decoding, evaluation, akurasi, ROUGE-2.ABSTRACT: Information overloaded is a popular term used to describe the difficulty in understanding an issue and making decisions, because too much information is obtained. Summarization is one of the solution to overcome the information overloaded problem. Summarization can be defined as translation from a language that has more words to a language that has less words. Extraction summary is a style of summary that reusing the words from original text, and then shrink the portion by deleting the words which are not essential, become one of summarization’s style that the researchers commonly used for article summary. Hybrid Statistic and Grammar Hidden Markov Model will be implemented with extraction summary, by calculating the weight from the connection between the words and the connection between the POS tagging in HMM’s evaluation phase. In decoding phase, summary is done by choosing the maximum probability path from bag of words which have connection’s weight from evaluation phase. Finally, by using ROUGE-2, by calculating the total of the same bigram from the result from automatic summarization with human’s summarization and divide by the number of existing bigram in the summary, then we get the accuracy of our summary.Keyword: information overloaded, summary, extraction, Hidden Markov Model, decoding, evaluation, ROUGE-2, accuracy.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis Penggunaan Hybrid Statistik dan Grammar Hidden Markov Model
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Abdul Ahkam
Perorangan
Imelda Atastina, Alfian Akbar Gozali
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini