Pembentukan Sentence-Aligned Korpus Paralel untuk Bahasa Sunda-Bahasa Indonesia Berbasis Wikipedia dengan Bootstrapping dan EM

IGNASIUS INDRA KUSUMA WIJAYA

Informasi Dasar

Pembentukan Sentence-Aligned Korpus Paralel untuk Bahasa Sunda-Bahasa Indonesia Berbasis Wikipedia dengan Bootstrapping dan EM

No. Katalog

17.04.515

Klasifikasi

006.312

Jenis katalog

Karya Ilmiah - Skripsi (S1) - Reference

Abstraksi

Ketersediaan korpus paralel pada pasangan bahasa Sunda-Indonesia masih sangat sedikit. Korpus paralel tersebut penting dan bisa dimanfaatkan sebagai sumber data latih dalam sistem machine translation atau sistem natural language processing. Penelitian ini mencoba untuk mengumpulkan kalimat paralel yang didapatkan dari pasangan artikel Wikipedia berbahasa Sunda dan berbahasa Indonesia menggunakan fasilitas interlanguage links. Sebuah bilingual lexicon dan beberapa filter yang berdasarkan pada kemunculan kata, panjang kalimat dan word overlap antar kalimat digunakan untuk mendapatkan kalimat paralel. Metode bootstrapping kemudian digunakan untuk meningkatkan kualitas kalimat paralel dengan cara memperbarui bilingual lexicon memanfaatkan IBM Model 4 expectation maximization (EM) learner di dalam tool GIZA++. GIZA++ dijalankan pada kandidat kalimat paralel yang dihasilkan di setiap iterasi sistem sampai kondisi konvergensi tercapai. Hasil evaluasi manual menggunakan penilaian manusia menunjukkan bahwa 79,5% dari korpus paralel hasil bentukan sistem terbukti paralel.

Subjek

Subjek utama

Text mining

Subjek tambahan

Katalog

Judul

Pembentukan Sentence-Aligned Korpus Paralel untuk Bahasa Sunda-Bahasa Indonesia Berbasis Wikipedia dengan Bootstrapping dan EM

ISBN

Kolasi

Bahasa

Sirkulasi

Harga pinjam

Rp. 0

Biaya denda

Rp. 0

Sirkulasi

Tidak

Pengarang

Nama

IGNASIUS INDRA KUSUMA WIJAYA

Jenis

Perorangan

Penyunting/
Pembimbing

Arie Ardiyanti Suryani, Kurniawan Nur Ramadhani

Alih bahasa

Penerbit

Nama

Universitas Telkom

Kota

Bandung

Tahun

2017

Koleksi

Total

1 Koleksi

Tersedia

1 Koleksi

Kompetensi

Tidak ada

Download / Flippingbook

Link file

A1. Jurnal ( Untuk di eProceeding ) (jurnal_eproc.pdf)

diunduh 7 kali

B. Cover (cover.pdf)

diunduh 1 kali

C. Disclaimer (Pernyataan Orisinalitas) yang sudah bertandatangan. (File discan agar document jelas dan rapi) (disclaimer.pdf)

belum pernah diunduh

D. Lembar Pengesahan yang sudah bertandatangan. (File discan agar document jelas dan rapi) (lembarpersetujuan.pdf)

diunduh 1 kali

E. Abstrak ( Indonesia ) (abstraksi.pdf)

diunduh 1 kali

F. Abstract (English) (abstract.pdf)

belum pernah diunduh

G. Lembar Persembahan (persembahan.pdf)

belum pernah diunduh

H. Kata Pengantar (kpdi.pdf)

belum pernah diunduh

I. Daftar Isi (daftarisi.pdf)

belum pernah diunduh

J. Daftar Gambar (daftargambar.pdf)

belum pernah diunduh

K. Daftar Tabel (daftartabel.pdf)

belum pernah diunduh

L. Daftar Istilah (daftaristilah.pdf)

belum pernah diunduh

O. BAB 1 (bab1.pdf)

diunduh 6 kali

P. BAB 2 (bab2.pdf)

diunduh 8 kali

Q. BAB 3 (bab3.pdf)

diunduh 5 kali

R. BAB 4 (bab4.pdf)

belum pernah diunduh

S. BAB 5 (bab5.pdf)

belum pernah diunduh

X. Daftar Pustaka (dp.pdf)

diunduh 1 kali

Y1. Lampiran (lampiran.pdf)

belum pernah diunduh

Y2. Lampiran (lampiran.zip)

belum pernah diunduh

Z. Materi Presentasi (materipresentasi.pdf)

belum pernah diunduh

Z1. Jurnal (jurnal.pdf)

belum pernah diunduh

Rekomendasi

Ulasan

Belum ada ulasan yang diberikan

anda harus sign-in untuk memberikan ulasan ke katalog ini

Kembali