ABSTRAKSI: Mesin translasi berbasis statistik merupakan suatu teknik pemrosesan bahasa alami berdasarkan ilmu statistik dengan menggunakan model pembelajaran dari sekumpulan kalimat sebagai data latihnya(corpus). Salah satu faktor yang sangat berpengaruh pada proses pelatihan dan menentukan kualitas hasil translasi adalah proses penerjemahan frasa-frasa yang terdapat pada corpus.
Dalam tugas akhir ini dilakukan pengimplementasian aturan koreksi level frasa pada mesin translasi berbasis statistik untuk memahami dan mengetahui seberapa besar pengaruh aturan ini pada kualitas hasil translasi mesin translasi berbasis statistik jika digunakan untuk menerjemahkan kalimat-kalimat dari Bahasa Inggris ke Bahasa Indonesia. Pengimplementasian dilakukan dengan membuat modul aturan koreksi level frasa, mengintegrasikannya pada mesin transalsi berbasis statistik, dan kemudian membandingkan kualitas hasil terjemahan mesin translasi berbasis statistik ber-aturan koreksi level frasa tersebut dengan hasil terjemahan beberapa mesin translasi, serta melakukan analisa terhadap hasil perbandingan tersebut.
Pada penelitian ini didapatkan bahwa aturan koreksi level frasa menurunkan kualitas hasil translasi mesin translasi berbasis statistik. Hal ini dikarenakan sifat contex-independent dan partial monotone alignment dari aturan tersebut, dan juga karena sudah adanya penanganan koreksi level frasa yang lebih baik pada mesin translasi berbasis statistik.Kata Kunci : mesin translasi berbasis statistik, corpus, frasa, aturan koreksi levelABSTRACT: Statistical-based machine translation is a natural language processing technique based on statistics by using learning model from a group of sentences (corpus) as training data. One of factor which has major influence in training process and determine the quality of translation result is the corpus’s phrase translation process.
This final project conducted the implementation of phrase-level correction rule method in statistical-based machine translation to know and understand the significance of this method’s influence in the quality of statistical-based machine translation’s output if applied to translate sentences from English to Indonesian. The implementation was done by make the phrase-level correction rule module, integrate it to statistical-based machine translation, and then compare the output of this phrase-level correction rule’s statistical machine translation with some other machine translation’s output, and finally analyze the comparation result to make the conclusion of the research.
In this research, found that the phrase-level correction rules decrease the quality of statistical-based machine translation’s output, because of it’s contexindependent and partial monotone alignment behavior, and also because of the better phrase correction method that has been applied in statistical-based machine translation.Keyword: statistical-based machine translation, corpus, phrase, phrase-level