ABSTRAKSI: Tugas akhir ini bertujuan untuk membuat perangkat lunak yang dapat
menghilangkan ambiguitas makna kata dalam kalimat berbahasa Indonesia. Latar
belakang pembuatan adalah bahwa bahasa Indonesia sebagai bahasa alami
memiliki kata yang bermakna lebih dari satu, sesuai konteks kalimat. Kata yang
bermakna lebih dari satu tersebut, berpotensi menyebabkan keragu-raguan atau
ambigu. Menghilangkan ambiguitas makna kata atau disebut juga word sense
disambiguation dilakukan dengan memilih makna yang tepat dari kata ambigu
dalam kalimat. Dalam tugas akhir ini, kata ambigu yang digunakan adalah
homograf.
Pemilihan makna dilakukan dengan menggunakan teknik pennggabungan
parser, wordnet, dan algoritma Lesk. Parser yang digunakan adalah PC-PATR,
yang merupakan tools implementasi aturan sintak kalimat bahasa Indonesia, hasil
penelitian [10].
Berdasarkan hasil pencarian terhadap berbagai macam artikel, maka
kriteria pengujian terhadap kalimat dibagi menjadi 7 tipe, yaitu berdasarkan
jumlah homograf dan jenis kelas kata yang dimiliki. 7 tipe kalimat tersebut dan
hasil pengujiannya, yaitu: tipe 1 (kalimat yang memiliki 1 homograf, kelas kata
berbeda jenis (6 kalimat)), berhasil menghilangkan ambiguitas makna sebanyak 5
kalimat; tipe 2 (kalimat yang memiliki 2 homograf sama, kelas kata berbeda jenis
untuk setiap homograf (2 kalimat)), berhasil menghilangkan ambiguitas makna
sebanyak 2 kalimat, tipe 3 (kalimat yang memiliki 2 homograf yang berbeda,
kelas kata berbeda jenis untuk setiap homograf (3 kalimat)), berhasil
menghilangkan ambiguitas makna sebanyak 2 kalimat; tipe 4 (kalimat yang
memiliki 2 buah homograf yang berbeda, kelas kata berbeda jenis dan sama
jenis(3 kalimat)), berhasil menghilangkan ambiguitas makna sebanyak 3 kalimat;
tipe 5 (kalimat yang memiliki 1 buah homograf, kelas kata yang sama jenis(6
kalimat)), berhasil menghilangkan ambiguitas makna sebanyak 4 kalimat; tipe 6
(kalimat yang memiliki 2 homograf, kelas kata yang sama jenis (3 kalimat)),
berhasil menghilangkan ambiguitas makna sebanyak 1 kalimat; tipe 7 (kalimat
yang memiliki 2 homograf berbeda, kelas kata yang sama jenis(3 kalimat)),
berhasil menghilangkan ambiguitas makna sebanyak 3 kalimat.
Hasil pengujian tersebut, sangat bergantung kepada kelengkapan basis data
dan hasil penguraian kalimat.Kata Kunci : word sense disambiguation; parser; wordnet;. algoritma Lesk.ABSTRACT: The purpose of this end task is making software of word sense disambiguation in
the Indonesian sentences.
The production background is Indonesian language has word which more than one
meaning, congruent with the sentence context. The word, which more than one
meaning, can cause ambiguous or hesitancy. Word sense disambiguation do it by
choosing appropriate meaning of ambiguous word in sentence. In this end task,
ambiguous word used is homograf.
Sense elections do it by using integration parser, wordnet, and Lesk
algorithm techniques. Parser which used is PC-PATR, which tools
implementation of syntax regulation of Indonesian sentence, based on research
[10].
Based on search to many articles, then type of sentence test divided into 7
type, which every type based on number of homograf and class type. Those 7
sentence type and test results are : type 1 (sentence which has 1 homograf,
different word class type (6 sentence)), successful to word sense disambiguation 5
sentences; type 2 (sentence which has 2 same homograf, different word class type
for every homograf (2 sentences)), successful to word sense disambiguation 2
sentences; type 3 (sentence which has 2 homograf different, different word class
type for every homograf (3sentences)), successful to word sense disambiguation 2
sentences; type 4 (sentence which has 2 homograf different, different word class
type and same word class type (3 sentences)), successful to word sense
disambiguation 3 sentences; type 5 (sentence which has 1 homograf same word
class type (6 sentences)), successful to word sense disambiguation 4 sentences;
type 6 (sentence which has 2 same homograf , same word class type (3
sentences)), successful to word sense disambiguation 1 sentence; type 7 (sentence
which has 2 different homograf, , same word class type and have different
meaning (3 sentences)), successful to word sense disambiguation 3 sentence.
Those testing result, depend on the data base completeness and sentence
decomposition result.Keyword: word sense disambiguation; parser; wordnet; Lesk algorithm.