Informasi Umum

Kode

25.04.5693

Klasifikasi

000 - General Works

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Deep Learning

Dilihat

105 kali

Informasi Lainnya

Abstraksi

Penulisan yang baik dalam bahasa Indonesia sangat penting untuk memastikan bahwa pesan yang terkandung dalam teks dapat dipahami dengan baik dan benar oleh pembacanya. Namun, berbagai jenis tulisan, seperti karya ilmiah, konten media sosial, ataupun artikel berita, masih sering mengandung kesalahan tata bahasa, khususnya dalam aspek sintaksis dan morfologis. Kesalahan seperti tidak adanya subjek atau predikat, struktur kalimat yang tidak logis, serta penggunaan preposisi dan konjungsi yang tidak tepat dapat menyebabkan kesalahpahaman. Saat ini, alat bantu otomatis untuk mendeteksi kesalahan tata bahasa Indonesia masih terbatas. Penelitian ini telah berhasil mengembangkan model<i> deep learning</i> berbasis arsitektur Transformer yang hanya menggunakan lapisan <i>encoder </i>untuk mendeteksi kesalahan tata bahasa secara otomatis. <i>Dataset</i> yang digunakan berupa kumpulan kalimat berbahasa Indonesia yang berjumlah satu juta kalimat. Tahapan penelitian ini melibatkan <i>pre-processing</i> data yang mencakup normalisasi berupa <i>filtering</i> dan <i>cleaning</i>, generasi kalimat sintetis dengan tata bahasa yang salah, tokenisasi menggunakan SentencePiece dengan Unigram Language Model, serta pelabelan token. Setelah <i>pre-processing</i>,<i> </i>dilakukan pelatihan, validasi, dan pengujian model. Penelitian ini juga telah berhasil melakukan perbandingan model arsitektur Transformer antara 1, 2, 3, dan 6 <i>encoder layers</i>, serta Bi-LSTM yang menggunakan <i>self-attention</i>. Hasil terbaik berhasil dicapai oleh Transformer dengan 6 <i>encoder layers</i>, dengan akurasi 93,46% dan <i>F1-score</i> 75,08% pada tingkat token, serta akurasi 78,82% dan <i>F1-score</i> 78,38% pada tingkat kalimat. Hal ini menunjukkan bahwa kedalaman <i>encoder layer</i> pada Transformer berpengaruh positif terhadap efektivitas deteksi kesalahan tata bahasa dimana urutan token berperan sebagai faktor kunci terhadap akurasi kalimat.

  • CAK3DAB3 - KECERDASAN ARTIFISIAL
  • CAK3JAB3 - PEMBELAJARAN MESIN
  • CAK4NBB3 - PENGOLAHAN BAHASA ALAMI

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama MUHAMMAD AMMAR IZZUDIN
Jenis Perorangan
Penyunting Sena Wijayanto, Andi Prademon Yunus
Penerjemah

Penerbit

Nama Universitas Telkom, S1 Teknik Informatika - Kampus Purwokerto
Kota Purwokerto
Tahun 2025

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi