PENGOREKSIAN EJAAN KATA MENGGUNAKAN METODE N-GRAM (STUDI KASUS DOKUMEN TEKS BERBAHASA INDONESIA)

Wedha Satya Wardhana

Informasi Dasar

113040316
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Kemudahan berkomunikasi saat ini menjadikan terjadinya pertukaran informasi yang sangat cepat, berbagai media informasi yang ada mulai dari televisi, Koran dan internet masih memanfaatkan tulisan sebagai salah satu cara menyampaikan informasi. Namun kadangkala informasi tersampaikan tidak sempurna karena adanya kendala diantaranya karena kesalahan penulisan secara tidak disengaja, oleh karena itu diperlukan adanya solusi pengecekan kata.

Proses pengoreksian kata terdiri atas 2 langkah, yaitu pengecekan kata yang salah dimana setiap kata yang diketik akan dicari apakah kata tersebut termasuk kata baku kemudian menandai kata yang salah eja. Langkah berikutnya yaitu mencari kata yang tepat untuk menggantikan kata yang salah tersebut.

Dalam tugas akhir ini sistem yang dibangun mengimplementasikan proses pengoreksian ejaan kata untuk bahasa Indonesia menggunakan bi-gram dan trigram kemudian menguji hasil koreksi dokumen. Parameter hasil pengujian meliputi waktu eksekusi dan jumlah kata yang dapat dikoreksi secara benar dengan mengunakan sistem ini. Pengujian menghasilkan akurasi mendekati sempurna untuk pengujian menggunakan user interaksi, dan untuk pengujian secara otomatis system menghasilkan akurasi dibawah 45 persen, namun dengan penggunaan threshold pada sistem, dapat menaikkan akurasi dengan rata-rata hasil diatas 60 persen. Untuk metode n-gram yang dilakukan, secara umum akurasi bigram sedikit lebih baik daripada trigram, adapun waktu respon sistem untuk memproses setiap kata salah berkisar antara 1~3 detik, sehingga dapat dikatakan respon sistem cukup tanggap dan dapat ditolerir oleh user pengguna.

Kata Kunci : spell correction, spell checker, spell suggestion, bigram, trigram.ABSTRACT: The easiness of communication makes the exchange of information very quickly, many information media ranging from television, newspapers and the Internet are still use writing as a way to convey information. Yet, sometimes the information conveyed through is still imperfect because of some constraints such as a typing error, therefore it need a solution to check for word error.

The process of word correction consists of two steps. First, check the error word in which every word you typed will be checked, if the word is considered as not a part of real word it then mark the word as misspelled words. The next step is to find the correct words to replace the error word.

In this final assignment, a system was built to implement words corrector for the Indonesian language documents by using bi-grams and trigrams method, then the system would test the results of the corrected documents. Parameter of test results including execution time and number of words that can be corrected properly by using this system. Test resulting in near perfect accuracy if used with user interaction, a little below 45 percent in automated, but it can greatly improved accuracy resulting by an average of above 60 percent if used in automated with threshold enabled. As for n-gram methods used, bigram is resulting slightly higher accuracy than trigram, at the expense of longer response time than trigram. And for the average system response time, it take about 1 ~ 3 seconds to process every error word, so it quite responsive and can still be tolerated by the normal user.

Keyword: spell correction, spell checker, spell suggestion, bigram, trigram.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

PENGOREKSIAN EJAAN KATA MENGGUNAKAN METODE N-GRAM (STUDI KASUS DOKUMEN TEKS BERBAHASA INDONESIA)
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Wedha Satya Wardhana
Perorangan
Tjokorda Agung Budi Wirayuda, Shaufiah
 

Penerbit

Universitas Telkom
Bandung
2011

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini