Informasi Umum

Kode

23.04.6645

Klasifikasi

006.35 - Natural Language Processing, Computer Science

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Natural Language Processing

Dilihat

19 kali

Informasi Lainnya

Abstraksi

<p>Bahasa merupakan alat komunikasi yang digunakan oleh manusia untuk bersosialisasi. Namun Indonesia memiliki banyak bahasa daerah yang beragam cara penulisan dan penyebutannya, disinilah pengidentifikasian bahasa berperan.<em> Language Identification </em>(LI) merupakan salah satu pengaplikasian menggunakan <em>Natural Languange Processing </em>(NLP). LI umumnya diselesaikan menggunakan pendekatan <em>Text Classification </em>(TC), dimana pada tugas akhir ini akan dilakukan identifikasi terhadap 10 bahasa daerah Indonesia berdasarkan dataset NusaX. Tujuan LI adalah untuk mengetahui bahasa apa yang digenean dalam suatu konteks. Metode yang digunakan untuk menyelesaikan task LI pada Tugas Akhir ini adalah<em> Support vector machine</em> (SVM), <em>Naïve Bayes Classifier </em>(NBC)<em>, Decision Tree </em>(DT), <em>Rocchio Classification</em> (RC), <em>Logistic Regression</em> (LR), <em>Random Forest</em> (RF)<em>, </em>dengan dua fitur yaitu N-gram dan TF-IDF. Tujuan dari penelitian ini adalah membangun model identifikasi bahasa daerah dan mengevaluasi kinerja dari enam metode dan dua fitur ekstraksi yang digunakan dalam melakukan pengidentifikasian 10 bahasa daerah Indonesia. Hasil pengujian menunjukkan bahwa identifikasi bahasa daerah Indonesia menggunakan enam model dan dua fitur menghasilkan performa yang sangat baik dengan model paling baik adalah NBC dengan akurasi 0.992 untuk TF-IDF dan 0.994 untuk N-Gram. <em>Error Analysis</em> (EA) dilakukan kepada hasil pengujian untuk mengetahui mengapa model dapat melakukan salah prediksi bahasa. EA menunjukkan penyebab salah prediksi bahasa adalah terdapat kata-kata yang mirip dalam bahasa lain dan mempunyai penyebaran kata yang lebih dominan pada bahasa lain.</p>

  • CII4E4 - TUGAS AKHIR

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama AZHAR BAIHAQI NUGRAHA
Jenis Perorangan
Penyunting Ade Romadhony
Penerjemah

Penerbit

Nama Universitas Telkom, S1 Informatika
Kota Bandung
Tahun 2023

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi