Klasifikasi Topik Pada Tweet Berbahasa Indonesia menggunakan Ekspansi fitur Fast-Text dengan Metode Support Vector Machine (SVM)

IMADUDDIN MUHAMMAD FADHIL

Informasi Dasar

22.04.688
006.312
Karya Ilmiah - Skripsi (S1) - Reference

Twitter merupakan platform sosial media populer yang memberi pengguna kemampuan untuk mengirim pesan teks dengan panjang maksimum 280 karakter yang menyebabkan banyak penggunaan variasi kata yang menyebabkan kesalahan penulisan kosakata dan saat ini semakin banyak tweet yang tersebar dan karena penyebaran yang sangat pesat menyebabkan kelebihan informasi. Dari permasalahan yang diangkat diperlukan kemampuan untuk mengenali kata yang memiliki kesalahan dalam penulisan dan mengkategorikan tweet kedalam kategori tertentu. Oleh karena itu, penelitian ini bertujuan untuk membangun sistem klasifikasi topik pada tweet yang dapat mempelajari kesalahan penulisan pada suatu kata dan Ekspansi fitur menggunakan vektor kata pretrained dari FastText dapat digunakan untuk mengenali kesalahan penulisan pada suatu kata karena proses pembangunan vektor kata dari FastText yang dapat mempelajari struktur internal dari sebuah kata yang akan dimanfaatkan pada model klasifikasi Support Vector Machine. Hasil terbaik dari penelitian ini mendapatkan akurasi sebesar 76.88% dengan penerapan ekspansi fitur pada top-1 namun penerapan ekspansi fitur menggunakan vektor kata pretrained Bahasa Indonesia pada top-2 sampai top-10 menurunkan kinerja klasifikasi Support Vector Machine.

Subjek

DATA MINING
Text mining,

Katalog

Klasifikasi Topik Pada Tweet Berbahasa Indonesia menggunakan Ekspansi fitur Fast-Text dengan Metode Support Vector Machine (SVM)
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

IMADUDDIN MUHAMMAD FADHIL
Perorangan
Yuliant Sibaroni S,
 

Penerbit

Universitas Telkom, S1 Informatika
Bandung
2022

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini