Abstrak
Di era globalisasi ini teknologi yang berkembang semakin pesat. Munculnya jejaring sosial yang semakin hari menjadi gaya hidup masyarakat, antara lain jejaring sosial Twitter. Twitter merupakan media social yang bertipe micro-blogging artinya yang mempunyai layanan secara tepat untuk mencari tahu apa saja yang terjadi di dunia maya, serta dapat mengirimkan tweet yang maksimalnya hanya 140 karakter dengan pencarian minimum keterlambatan. Untuk meningkatkan kinerja aplikasi, Twitter sendiri memiliki fitur-fitur yang mendukung untuk setiap kegunaannya. Serta akhirnya dengan berkembangnya penggunaan Twitter, maka berkembangnya pula kegiatan spam yang meningkat. Kasus ini menjadi meningkat karena setiap orang dapat membaca data dan tweet orang lain tanpa memiliki akun Twitter terlebih dahulu. Penelitian tugas akhir ini akan membahas bagaimana mendeteksi spammer, dalam hal ini kita memerlukan crawling data untuk mendapatkan data-data yang dibutuhkan. Atribut-atribut yang digunakan pada tugas akhir ini seperti, jumlah follower, jumlah following, jumlah tweet, jumlah like, jumlah URL, jumlah mention, jumlah,hashtag, jumlah spamwords internasional, dan spamwords Indonesia. Pada deteksi spammer untuk memiliki performansi yang baik, harus diuji dengan tahap-tahap preprocessing, seperti Normalsasi Data, Reduksi Data (Seleksi Atribut Manual (Manual Atrtibute Selection), Chi Square Attribute Eval, Gain Ratio Attribute Eval, dan Info Gain Attribute Eval), Diskritisasi Data dan perhitungan akurasi pada klasifikasi Random Forest, Support Vector Machine (SVM), Naïve Bayes, dan J48. Untuk hasil yang didapat dari tahapan preprocessing, hasil dari penelitian ini dapat dilihat dari kualitas sumber data dengan menggunakan teknik Preprocessing data yang tepat dan benar. Sehingga, pada tugas akhir ini nilai performansi yang terbaik 88.34% yang didapatkan tanpa melakukan tahap preprocessing pada klasifikasi Naïve Bayes.
Kata kunci: Twitter, Deteksi Spammer, Preprocessing Data