Informasi Umum

Kode

19.04.1527

Klasifikasi

C -

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Text Mining

Dilihat

238 kali

Informasi Lainnya

Abstraksi

Terdapat banyak jenis data dalam kasus klasifikasi teks. Oleh karena itu, perlu penanganan khusus agar sesuai dengan karakteristik data yang digunakan. Ekstraksi fitur, pembobotan fitur, dan preprocessing menjadi tiga fokus pada penelitian kali ini untuk data multilabel Hadits Bukhari dalam terjemahan Bahasa Indonesia. Penelitian ini mengguanakan ekstraksi fitur berbasis aturan yang dikombinasikan dengan beberapa jenis preprocessing beserta tiga jenis metode pembobotan fitur, yaitu TF-IDF, Word2vec, dan penggabungan Word2vec dengan TF-IDF. Dari 13 kali eksperimen yang telah kami lakukan, menunjukkan bahwa performansi terbaik untuk klasifikasi multilabel pada data Hadits yang kami gunakan dihasilkan dari kombinasi ekstraksi fitur berbasis aturan yang diusulkan, pembobotan fitur Word2vec, dan tanpa menggunakan Stemming dan Stopword Removal pada tahap preprocessing. Dari hasil terbaik yang diperoleh, membuktikan bahwa metode ekstraksi fitur berbasis aturan lebih baik jika dibandingkan dengan metode baseline.

Kata kunci : klasifikasi multilabel, Hadits Bukhari, ekstraksi fitur, TF-IDF, Word2vec, preprocessing.

  • CIG4A3 - PEMBELAJARAN MESIN
  • CSH4O3 - PEMROSESAN BAHASA ALAMI
  • CSH4G3 - PENAMBANGAN DATA
  • CSH4H3 - PENAMBANGAN TEKS
  • CCH4D4 - TUGAS AKHIR
  • CII4G3 - PEMROSESAN BAHASA ALAMI
  • CII4I3 - PENAMBANGAN DATA
  • CII4E4 - TUGAS AKHIR
  • CPI4I3 - PENAMBANGAN DATA
  • III4A4 - TUGAS AKHIR

Koleksi & Sirkulasi

Seluruh 1 koleksi sedang dipinjam

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama GUGUN MEDIAMER
Jenis Perorangan
Penyunting ADIWIJAYA, SAID AL FARABY
Penerjemah

Penerbit

Nama Universitas Telkom
Kota Bandung
Tahun 2019

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi