Analisis sentimen pada ulasan film menjadi semakin penting seiring dengan meningkatnya volume data tekstual. Performa model machine learning untuk tugas ini sangat bergantung pada kualitas representasi teks yang digunakan. Penelitian ini bertujuan untuk mengevaluasi efektivitas model embedding teks kontekstual dari OpenAI, Text-embedding-3-large, untuk klasifikasi sentimen pada dataset Movie Reviews. Metodologi penelitian mencakup dua pendekatan klasifikasi: supervised learning menggunakan Support Vector Machine dan Logistic Regression, serta klasifikasi zero-shot. Performa Text-embedding-3-large dibandingkan secara langsung dengan model embedding statis Word2Vec pada dataset yang telah dibersihkan dan dataset asli. Hasil penelitian menunjukkan bahwa Text-embedding-3-large secara signifikan mengungguli Word2Vec, dengan peningkatan F1-score dari 78.01% menjadi 93.20%. Konfigurasi terbaik dicapai oleh kombinasi Support Vector Machine dengan hyperparameter default pada dataset yang tidak dibersihkan, yang mengindikasikan kemampuan model memanfaatkan informasi kontekstual dari tanda baca. Selain itu, pendekatan zero-shot menunjukkan kinerja yang cukup baik dengan F1-score 86.29%, yang membuktikan kapabilitas generalisasi model tanpa memerlukan data latih berlabel.