Implementasi Modifikasi Algoritma Enhanced Confix Stripping Stemmer pada Teks Bahasa Indonesia

Noverdy Anggara

Informasi Dasar

113080243
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Stemming merupakan proses pembentukan kata dasar dari kata-kata yang telah mendapatkan modifikasi dalam penggunaannya. Penggunaan kata yang terdapat pada kalimat terstruktur diantaranya sudah mendapat imbuhan yang terdiri dari awalan, akhiran ataupun sisipan. Stemming merupakan bagian dari Preprocessing, yaitu fase terakhir setelah Tokenization dan Stoplist Removal. Proses stemming berbeda dalam tiap bahasa karena dalam pembentukan kata memiliki perbedaan pada tiap bahasa. Pada bahasa Indonesia, ada beberapa algoritma yang dapat dipakai dalam proses stemming, diantaranya Algoritma Arifin-Setiono, Algoritma Nazief-Adriani dan Algoritma Enhanced Confix Stripping (ECS) Stemmer. Algoritma ECS adalah algortima perbaikan dari algoritma Confix Stripping (CS) Stemmer.

Pada tugas akhir ini akan diajukan implementasi dan modifikasi algoritma Enhanced Confix Stripping Stemmer pada teks berbahasa Indonesia. Algoritma Enhanced Confix Stripping Stemmer memiliki kekurangan dan keterbatasan dalam menangani kata yang memiliki sisipan dan kata yang memiliki huruf akhir seperti akhiran. Modifikasi algortima Enhanced Confix Stripping Stemmer dirancang untuk melakukan perbaikan terhadap kelemahan tersebut. Dari hasil pengujian akan terlihat perbedaan tingkat akurasi antara algoritma Ehnanced Confix Stripping Stemmer dan modifikasi algoritma Ehnanced Confix Stripping Stemmer, akan dibuktikan bahwa skema yang telah dimodifikasi dapat menghasilkan nilai akurasi yang lebih tinggi.Kata Kunci : Stemming, Enhanced Confix Stripping Stremmer, Imbuhan, Preprocessing.ABSTRACT: Stemming is the process of forming the base of the words that have been getting modifications in its use. The use of words contained in the sentence structure of which have got Affixes include prefixes, suffixes, or infixes. Stemming is part od the Preprocessing, which is the last phase after Tokenization and Stoplist Removal. Stemming process is different in each language because the word has a different formation in each language. In Indonesia, there are several algorithms that can be used in the process of stemming, such like Arifin-Setiono Algorithm, Nazief-Adriani Algorithm and Enhanced Confix Stripping Stemmer (ECS) Stemmer. ECS algorithm is a refinement of the Confix Stripping Stemmer algorithm.

This final project will be presented and the implementations of ECS Stemmer algorithm and its modifications to the Indonesian language text. Enhanced Confix Stripping Stemmer Algorithm have drawbacks and limitations in dealing with infixes and few letter in th end part of word that such as suffix. Modifications of Enhanced Confix Stripping Stemmeris designed to repair the weakness. From the test result will be seen the difference between the accuracy of the Enhanced Confix Stripping Stemmer algorithm and its modification, it will be proven that the scheme has been modified to produce a higher accuracy value.Keyword: Stemming, Enhanced Confix Stripping Stemmer, Affixes, Preprocessing.

Subjek

Informatika Teori dan Pemrograman
 

Katalog

Implementasi Modifikasi Algoritma Enhanced Confix Stripping Stemmer pada Teks Bahasa Indonesia
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Noverdy Anggara
Perorangan
Ade Romadhony, Mahmud Dwi Suliiyo
 

Penerbit

Universitas Telkom
Bandung
2013

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini