Klasifikasi Data Tweet dengan Menggunakan Metode Klasifikasi Multi-Class Support Vector Machine (SVM) (Studi Kasus : PT.KAI)

DHINA NUR FITRIANA

Informasi Dasar

124 kali
20.04.2104
006.31
Karya Ilmiah - Skripsi (S1) - Reference

Informasi dalam bentuk dokumen berbasis teks yang tidak terstruktur semakin banyak dan menjadi hal biasa keberadaannya di internet. Informasi tersebut sering ditemukan secara mudah dan dimanfaatkan oleh pelaku bisnis atau perusahaan melalui media sosial. Salah satu media sosial yang dibahas pada penelitian ini adalah Twitter. Twitter menempati peringkat ke-6 sebagai media sosial yang banyak diakses saat ini yaitu sebanyak 52 % pengguna di Indonesia. Pemakaian Twitter memiliki kelemahan yaitu data teks tidak terstruktur dan berjumlah banyak yaitu mencapai 2400 tweet per harinya. Hal ini mempersulit pelaku bisnis atau perusahaan mengetahui sentimen publik terhadap suatu layanan dengan sumber daya terbatas. Sentimen publik pada Twitter perlu diklasifikasikan ke dalam netral tidak hanya positif dan negatif agar dapat mempermudah perusahaan mengetahui sentimen publik untuk pelayanan yang lebih baik di masa yang akan datang. Metode Support Vector Machine (SVM) merupakan metode klasifikasi yang optimal dibandingkan metode Naïve Bayes. Kekurangan dari metode Support Vector Machine (SVM) yaitu menggunakan fungsi pemisah yang memisahkan data ke dalam dua kelas, jika kelas yang ingin dipisahkan lebih dari dua maka dibutuhkan modifikasi dan mempengaruhi waktu pelatihan dan ukuran memory yang dibutuhkan. Untuk menangani kasus klasifikasi non-biner pada penelitian ini diperlukan pendekatan multi-class Support Vector Machine (SVM) yang menangani klasifikasi tiga kelas. Penelitian ini menggunakan pendekatan One Againts All sebagai model untuk menentukan kelas yang tepat. Pendekatan One Againts All memiliki akurasi yang lebih baik dibandingkan One Againts One. Penelitian ini berisi hasil implementasi metode multi-class Support Vector Machine (SVM) OAA dengan lima fitur yang berbeda yaitu unigram, bigram, trigram, unigram+bigram, dan wordcloud saat mengklasifikasikan data tweet dalam jumlah yang banyak. Nilai akurasi tertinggi berasal dari pengujian model TF-IDF unigram yang dikombinasikan dengan metode klasifikasi multi-class Support Vector Machine (SVM) dengan nilai parameter gamma 0.7 yaitu 80.59. Multiclass Support Vector Machine (SVM) dapat mengklasifikasikan kelas netral dengan baik karena banyaknya opini yang bersifat netral yaitu sebanyak 365 kalimat dari 402 kalimat netral namun, jika menggunakan metode Support Vector Machine binary class opini netral sulit diklasifikasikan.

Subjek

Machine Learning
 

Katalog

Klasifikasi Data Tweet dengan Menggunakan Metode Klasifikasi Multi-Class Support Vector Machine (SVM) (Studi Kasus : PT.KAI)
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

DHINA NUR FITRIANA
Perorangan
YULIANT SIBARONI
 

Penerbit

Universitas Telkom, S1 Informatika
Bandung
2020

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini