Informasi Umum

Kode

22.04.1077

Klasifikasi

004 - Data Processing, Computer Science/Pemrosesan Data, Ilmu Komputer, Teknik Informatika, Hardware Komputer

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Classification

Dilihat

132 kali

Informasi Lainnya

Abstraksi

Twitter merupakan layanan mikroblog yang memungkinkan pengguna dapat mengirim dan membaca tweet atau pesan dengan batasan hanya 280 karakter per tweet. Hal ini menyebabkan tweet yang ditulis cukup singkat, tidak selalu menggunakan tata Bahasa yang benar, dan sering menggunakan Bahasa gaul. Seringkali, percobaan klasifikasi topik dalam tweet mengalami akurasi rendah dikarenakan faktor-faktor tersebut. Maka dari itu, penelitian ini mengimplementasikan ekspansi fitur untuk mengurangi ketidakcocokan kata dan mengurangi fitur yang bernilai 0 menjadi nilai dari similarity katanya jika similarity katanya muncul pada tweet tersebut. Proses ekspansi fitur tersebut dapat membuat vektor representasi tweet yang ukuran dimensinya cukup besar dan sparse bisa membuat mesin mendapat semantik informasinya dan menghasilkan akurasi yang bagus. Metode ekspansi fitur ini mencari similarity dari katanya menggunakan fastText. Hasil penelitian menunjukan bahwa sistem klasifikasi topik menggunakan metode Gradient Boosted Decision Tree dan dengan ekspansi fitur memiliki akurasi tertinggi yaitu 91,39%.

Koleksi & Sirkulasi

Seluruh 1 koleksi sedang dipinjam

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama REZA AHMAD YAHYA
Jenis Perorangan
Penyunting ERWIN BUDI SETIAWAN
Penerjemah

Penerbit

Nama Universitas Telkom, S1 Informatika
Kota Bandung
Tahun 2022

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi