Informasi Umum

Kode

113080243

Klasifikasi

005.1 - Computer programming

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Informatika Teori Dan Pemrograman

Informasi Lainnya

Abstraksi

ABSTRAKSI: Stemming merupakan proses pembentukan kata dasar dari kata-kata yang telah mendapatkan modifikasi dalam penggunaannya. Penggunaan kata yang terdapat pada kalimat terstruktur diantaranya sudah mendapat imbuhan yang terdiri dari awalan, akhiran ataupun sisipan. Stemming merupakan bagian dari Preprocessing, yaitu fase terakhir setelah Tokenization dan Stoplist Removal. Proses stemming berbeda dalam tiap bahasa karena dalam pembentukan kata memiliki perbedaan pada tiap bahasa. Pada bahasa Indonesia, ada beberapa algoritma yang dapat dipakai dalam proses stemming, diantaranya Algoritma Arifin-Setiono, Algoritma Nazief-Adriani dan Algoritma Enhanced Confix Stripping (ECS) Stemmer. Algoritma ECS adalah algortima perbaikan dari algoritma Confix Stripping (CS) Stemmer.<br><br>Pada tugas akhir ini akan diajukan implementasi dan modifikasi algoritma Enhanced Confix Stripping Stemmer pada teks berbahasa Indonesia. Algoritma Enhanced Confix Stripping Stemmer memiliki kekurangan dan keterbatasan dalam menangani kata yang memiliki sisipan dan kata yang memiliki huruf akhir seperti akhiran. Modifikasi algortima Enhanced Confix Stripping Stemmer dirancang untuk melakukan perbaikan terhadap kelemahan tersebut. Dari hasil pengujian akan terlihat perbedaan tingkat akurasi antara algoritma Ehnanced Confix Stripping Stemmer dan modifikasi algoritma Ehnanced Confix Stripping Stemmer, akan dibuktikan bahwa skema yang telah dimodifikasi dapat menghasilkan nilai akurasi yang lebih tinggi.Kata Kunci : Stemming, Enhanced Confix Stripping Stremmer, Imbuhan, Preprocessing.ABSTRACT: Stemming is the process of forming the base of the words that have been getting modifications in its use. The use of words contained in the sentence structure of which have got Affixes include prefixes, suffixes, or infixes. Stemming is part od the Preprocessing, which is the last phase after Tokenization and Stoplist Removal. Stemming process is different in each language because the word has a different formation in each language. In Indonesia, there are several algorithms that can be used in the process of stemming, such like Arifin-Setiono Algorithm, Nazief-Adriani Algorithm and Enhanced Confix Stripping Stemmer (ECS) Stemmer. ECS algorithm is a refinement of the Confix Stripping Stemmer algorithm.<br><br>This final project will be presented and the implementations of ECS Stemmer algorithm and its modifications to the Indonesian language text. Enhanced Confix Stripping Stemmer Algorithm have drawbacks and limitations in dealing with infixes and few letter in th end part of word that such as suffix. Modifications of Enhanced Confix Stripping Stemmeris designed to repair the weakness. From the test result will be seen the difference between the accuracy of the Enhanced Confix Stripping Stemmer algorithm and its modification, it will be proven that the scheme has been modified to produce a higher accuracy value.Keyword: Stemming, Enhanced Confix Stripping Stemmer, Affixes, Preprocessing.

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama Noverdy Anggara
Jenis Perorangan
Penyunting Ade Romadhony, Mahmud Dwi Suliiyo
Penerjemah

Penerbit

Nama Universitas Telkom
Kota Bandung
Tahun 2013

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi