Klasifikasi Sentimen pada Dataset Ulasan Film menggunakan Machine Learning dan OpenAI Text Embedding - Dalam bentuk buku karya ilmiah

AZZAM ABDURRAHMAN

Klasifikasi Sentimen pada Dataset Ulasan Film menggunakan Machine Learning dan OpenAI Text Embedding - Dalam bentuk buku karya ilmiah

AZZAM ABDURRAHMAN

Informasi Dasar

Klasifikasi Sentimen pada Dataset Ulasan Film menggunakan Machine Learning dan OpenAI Text Embedding - Dalam bentuk buku karya ilmiah

Dilihat

38 kali

No. Katalog

25.04.2937

Klasifikasi

000

Jenis katalog

Karya Ilmiah - Skripsi (S1) - Reference

Abstraksi

Analisis sentimen pada ulasan film menjadi semakin penting seiring dengan meningkatnya volume data tekstual. Performa model machine learning untuk tugas ini sangat bergantung pada kualitas representasi teks yang digunakan. Penelitian ini bertujuan untuk mengevaluasi efektivitas model embedding teks kontekstual dari OpenAI, Text-embedding-3-large, untuk klasifikasi sentimen pada dataset Movie Reviews. Metodologi penelitian mencakup dua pendekatan klasifikasi: supervised learning menggunakan Support Vector Machine dan Logistic Regression, serta klasifikasi zero-shot. Performa Text-embedding-3-large dibandingkan secara langsung dengan model embedding statis Word2Vec pada dataset yang telah dibersihkan dan dataset asli. Hasil penelitian menunjukkan bahwa Text-embedding-3-large secara signifikan mengungguli Word2Vec, dengan peningkatan F1-score dari 78.01% menjadi 93.20%. Konfigurasi terbaik dicapai oleh kombinasi Support Vector Machine dengan hyperparameter default pada dataset yang tidak dibersihkan, yang mengindikasikan kemampuan model memanfaatkan informasi kontekstual dari tanda baca. Selain itu, pendekatan zero-shot menunjukkan kinerja yang cukup baik dengan F1-score 86.29%, yang membuktikan kapabilitas generalisasi model tanpa memerlukan data latih berlabel.