Implementasi dan Optimasi Algoritma Nazief dan Adriani untuk Stemming Dokumen Bahasa Indonesia

Shandy Ardiansyah Abdurrasyid

Implementasi dan Optimasi Algoritma Nazief dan Adriani untuk Stemming Dokumen Bahasa Indonesia

Shandy Ardiansyah Abdurrasyid

Informasi Dasar

Implementasi dan Optimasi Algoritma Nazief dan Adriani untuk Stemming Dokumen Bahasa Indonesia

Dilihat

680 kali

No. Katalog

113080245

Klasifikasi

005.1

Jenis katalog

Karya Ilmiah - Skripsi (S1) - Reference

Abstraksi

ABSTRAKSI: Penelitian ini mencoba mengimplementasi algoritma Nazief dan Andriani, yaitu algoritma yang dikembangkan untuk stemming dokumen Bahasa Indonesia. Yaitu suatu proses pemotongan imbuhan-imbuhan suatu kata menjadi kata dasarnya yang merupakan suatu tahap penting dalam Information Retrieval.

Setelah diimplementasi, kata-kata yang gagal di-stem kemudian diteliti untuk penyusunan skema perbaikan algoritma tersebut.

Setelah dilakukan pengujian pada skema perbaikannya serta membandingkan dengan skema yang lama, terbukti bahwa skema tersebut dapat menghasilkan nilai akurasi yang lebih tinggi serta nilai indeks MWC dan ICF yang lebih baik. Namun, muncul permasalahan lain yaitu munculnya kasus unstemmed word yang tidak muncul sebelumnya, walau jumlahnya tidak sesignifikan jumlah kasus yang berhasil di tangani.Kata Kunci : Stemming, Information Retrieval, Bahasa IndonesiaABSTRACT: This research focused on implementation of Nazief and Andriani algorithm, an algorithm specially developed for stemming for Indonesian Language documents. Stemming is a process where a word reverted to its root word. This process is a vital phase on Informational Retrieval study.

After the implementation, the words that failed to be stemmed are analized to create a new, improved version of Nazief-Andriani algorithm. Then, the improved version of Nazief and Adriani algorithm implemented for once more and compared to its previous version.

It turned out that the new scheme has better accuracy, MWC and ICF indexes than the old one. Meanwhile, another unstemmed cases, unknown to the previous algorithm appeared. However, they were less significant than the succefully handled previously unstemmed word.Keyword: Stemming, Information Retrieval, Indonesian Language