Informasi Umum

Kode

21.04.2856

Klasifikasi

006.312 - Data mining

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Data Mining

Dilihat

110 kali

Informasi Lainnya

Abstraksi

Twitter merupakan media sosial yang memberikan fitur bagi penggunannya untuk membaca dan menulis pesan yang disebut “tweet”. Untuk dapat memahami kepribadian seseorang, postingan di media sosial yaitu Twitter dapat digunakan sebagai sumber informasi. Big Five dalam dunia psikologi merupakan salah satu metode untuk menginterpretasi kepribadian seseorang. Kepribadian yang sesuai memiliki dampak secara langsung pada kinerja di tempat kerja. Personality fit akan melihat bagaimana kepribadian seseorang sesuai dengan pekerjaan dan budaya perusahaan. Pada penelitian ini, metode C4.5 digunakan untuk membuat model klasifikasi kepribadian pengguna Twitter yang terdiri dari lima kelas yaitu Openness, Consciousness, Extraversion, Agreeableness, Neuroticism. Dataset yang diperoleh menggunakan API Twitter. Dilakukan percobaan dengan skenario mendapat rasio data dari akurasi perilaku sosial sebagai baseline, penambahan data TF-IDF dan LIWC dan menerapkan metode SMOTE yang diujikan menerapkan teknik hyperparameter tuning menggunakan Grid Search dengan perilaku sosial sebagai baseline. Hasil akurasi yang diperoleh dengan penambahan data TF-IDF dan LIWC sebesar 62.06% dengan kenaikan akurasi sebesar 17.24% dari baseline dan menggunakan metode SMOTE dapat meningkatkan nilai akurasi menjadi 76.92% dengan kenaikan nilai akurasi sebesar 32.1% dari baseline. Dari fitur dengan nilai akurasi terbaik dalam percobaan, dihasilkan model pohon keputusan deteksi kepribadian Big Five.

Kata kunci : Big Five, Klasifikasi C4.5, TF-IDF, LIWC

Koleksi & Sirkulasi

Seluruh 1 koleksi sedang dipinjam

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama SHANTIKA VALERIN THERIK
Jenis Perorangan
Penyunting Erwin Budi Setiawan,
Penerjemah

Penerbit

Nama Universitas Telkom, S1 Informatika
Kota Bandung
Tahun 2021

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi