Analisis dan Implementasi Part of Speech Tagging untuk Bahasa Indonesia dengan Metode Latent Descriptor Clustering

Arga Sihaloho S

Informasi Dasar

113080279
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Part of Speech Tagging merupakan proses penentuan tag kelas kata pada bahasa tertentu. Penentuan tag kelas kata menjadi hal yang sangat penting. Hal ini berkaitan dengan tingkat kebutuhan user dalam mengakses informasi. Maka, penulis melakukan penelitian untuk menghasilkan sistem POS Tagging berupa POS Tagger Bahasa Indonesia dengan menggunakan metode Latent Descriptor Clustering. Metode Latent Descriptor Clustering melakukan sebuah pendekatan dimana tiap token yang terdapat pada korpus akan didefinisikan dan diproses (preprocessing) menjadi vektor latent deskriptor. Deskriptor tersebut diakses dari konteks kiri dan konteks kanan pada tiap token di dalam korpus. Metode tersebut akan menghasilkan output tag kelas kata dan akurasi tag kelas kata. Hasil akurasi tag kelas kata dipengaruhi oleh input parameter sigma1 dan konstanta. Akan tetapi, input parameter iterasi tidak berpengaruh terhadap hasil akurasi tag kelas kata. Selain itu, jumlah token yang semakin besar dapat menghasilkan hasil akurasi tag kelas kata menjadi lebih besar.Kata Kunci : POS Tagging, latent descriptor clustering, preprocessing, konteks kiri, konteks kanan, vektor latent deskriptorABSTRACT: Part of Speech Tagging is determining tag process of the language. Determining tag process become very important. It related for the user requirement to access information. So, the author will produces POS Tagging system, that is POS Tagger for Indonesian Language with Latent Clustering Descriptor method. Latent Descriptor Clustering method makes an approach where every token contained in the corpus has been defined and processed (preprocessing) used a latent descriptor vector. Descriptor is accessed from the immediate left context and right context of each token in the corpus. The method will produces tag output and tag accuracy. The result of tag accuracy is affected by parameter input sigma1 and constant value. However, iteration input doesn't affect the result of tag accuracy. In addition, the number of tokens can produces tag accuracy which it becomes very great.Keyword: POS Tagging, latent descriptor clustering, preprocessing, left context, right context, latent descriptor vector

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis dan Implementasi Part of Speech Tagging untuk Bahasa Indonesia dengan Metode Latent Descriptor Clustering
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Arga Sihaloho S
Perorangan
Imelda Atastina, Ade Romadhony
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini