Pengguna social media Twitter biasanya hanya tertarik pada tweet yang termasuk dalam jenis topik tertentu. Tweet yang hanya memuat tidak lebih dari 140 karakter, membuat klasifikasi tweet menjadi banyak tantangan, karena tweet yang pendek, noice, dan kurang fokus pada topik. Solusi untuk menyelesaikan tantangan tersebut dalam penelitian ini menggunakan fitur ekspansi agar memperkaya teks sehingga tampak seperti dokumen teks berukuran besar. Metode yang dipilih pada fitur ekspansi adalah Word2Vec, untuk mengelompokkan vektor dari kata-kata yang mirip menjadi satu di dalam ruang vektor, artinya mendeteksi kemiripan secara matematis. Penulis menggunakan metode Random Forest untuk klasifikasi data tweet pada penelitian ini, karena terkenal karena menjaga ketidak seimbangan data di kelas yang berbeda, terutama kumpulan data yang sangat besar.