PENGOREKSIAN EJAAN KATA MENGGUNAKAN TEKNIK LEVENSHTEIN-AUTOMATA

FIRDAH TIA YULIANA

Informasi Dasar

113030052
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Kebutuhan akan adanya pengolah kata yang bisa memberikan fasilitas pengoreksian ejaan kata dalam bahasa Indonesia dirasa sangat penting. Jika sebuah kamus elektronik tersedia dan mencakup semua kemungkinan kata, pemilihan representasi kamus (lexicon) dan teknik untuk mencari kandidat-kandidat kata yang bagus untuk kata yang salah tersebut sangat penting. Pada tugas akhir ini, digunakan sebuah acyclic deterministic finite automata (ADFA) sebagai representasi lexicon karena dapat mengecek keberadaan suatu kata dalam lexicon dengan cepat dan teknik Levenshtein-automata untuk mencari kandidat-kandidat koreksi yang bagus. Levenshtein-automata merepresentasikan sebuah acyclic DFA yang membentuk himpunan semua string dimana jarak editnya dengan string masukan tidak melebihi batasan yang sudah ditentukan (levenshtein-distance) [11]. Karena struktur morfologi kata dalam Bahasa Indonesia sangat kompleks maka jika sebuah kata tidak ada dalam lexicon diperlukan sebuah proses stemming. Stemming adalah proses pengambilan kata dasar dari kata kerja yang berimbuhan. Dari hasil pengujian didapatkan nilai akurasi fungsi stemming untuk pengecekan teks adalah 96,75768 % dan validitas koreksi kata yang diberikan adalah 82,37623 %.
Kata Kunci : pengoreksian ejaan kata, Levenshtein-automata, Levenshtein-distance, ADFA, stemming.ABSTRACT: The need of word processor that have spell correction fasility in Bahasa Indonesia is very important. If an electronic dictionary is available that covers the possible input words, the choice of dictionary representation and the technique how to find good corrections candidates for a garbled input word is very important. In this final project, we use an acyclic deterministic finite automata (ADFA) as an effective representation of the lexicon that allows fast checking for the existence of a word in the lexicon and the Levenshtein-automata technique to find good corrections candidates. A Levenshtein-automaton represents an acyclic DFA, which encodes the set of all string, whose edit distance from the input string does not exceed the given bound k (levenshtein-distance) [11]. Because of the morphological structure of Bahasa Indonesia words is complicated then if a word is absent from the lexicon, the stemming is needed. Stemming is a process to find base/common word from word that have preffix and suffix. The testing result shows that the accuration of stemming function for checking texts is 96,75768 % and the validity of candidate corrections is 82,37623 %.Keyword: Spell correction, Levenshtein-automata, Levenshtein-distance, ADFA,

Subjek

Informatika Teori dan Pemrograman
 

Katalog

PENGOREKSIAN EJAAN KATA MENGGUNAKAN TEKNIK LEVENSHTEIN-AUTOMATA
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

FIRDAH TIA YULIANA
Perorangan
Ririn Dwi Agustin, Arie Ardiyanti Suryani
 

Penerbit

Universitas Telkom
Bandung
2007

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini