ABSTRAKSI: Opini ada salah satu alat yang menggambarkan ekspresi seseorang. Opini saat ini sangat dibutuhkan untuk menentukan kualitas produk perusahaan terhadap konsumen. Berdasarkan hal tersebut, Orientation Detection yaitu cara menentukan opini tersebut positif atau negatif menjadi sangat penting bagi perusahaan. Saat ini blog merupakan salah satu media jejaring sosial , dimana orang biasa mengekspresikan pendapatnya. Klasifikasi opini menjadi tidak mudah karena opini memiliki gaya bahasa yang bermacam-macam.
Permasalahan klasifikasi tersebut diselesaikan dengan menerapkan algoritma Multinomial Naive Bayes Classifier dan dengan memanfaatkan pos tagger lexicon berbahasa indonesia. Multinomial naïve bayes classifier bekerja berdasarkan sekumpulan bukti (evidence) dan kelas (class). Dengan melakukan pelatihan (training) terhadap sebagian data sampel, dapat ditentukan probabilitas kepastian (likelihood probability) dari sebuah bukti jika diberikan kelas tertentu. Multinomial naïve bayes classifier juga menggunakan probabilitas sebelumnya (prior probability) dari sebuah kelas, yang perhitungannya dapat didasarkan dari sampel data tersebut. Dari analisis sampel data tersebut, jika diberikan sebuah dokumen baru yang terdiri dari sekumpulan bukti, probabilitas setiap kelas terhadap dokumen tersebut (posterior probability) dapat ditentukan.
Pada tugas akhir ini dilakukan perbandingan akurasi dengan metode multinomial naive bayes dengan feature selection dan tanpa feature selection. Hasil percobaan menunjukkan bahwa tahap feature selection meningkatkan akurasi metode Multinomial naive Bayes Classifier.
Kata Kunci : opini, feature selection, klasifikasi, multinomial naive bayesABSTRACT: Opinion is one tool that describes the expression of someone. Today, opinion is needed to determine the quality of company’s product for consumers. Based on this, Orientation Detection is how to determine the positive or negative opinion is important for the company. Currently blog is one of social networking media, where ordinary pepople express their opinions. Opinion Classification won’t be easy because language has a style that is mixed.
Opinion Classification is solved by applying the Multinomial Naive Bayes algorithm and by utilizing the pos tagger lexicon for bahasa. Multinomial Naive Bayes Classifier works on the collection of evidence and class. By doing the training against most of the data sample, can be determined the probability of certainty (likelihood probability) of proof if give particulary class. Multinomial Naive Bayes Classifier was also used prior probability of a class, which the calculations can be based from sample data. From the analysis of sample data, if given a new document that consists of collection evidence, the probability each class to the document can be determined.
In this final exam, writer will compare the accuracy of Multinomial Naive Bayes Classifier with and without feature selection. The experimental results show that stage of feature selection increase the accuracy of Multinomial Naive Bayes.
Keyword: opinion, feature selection, classification, multinomial naive bayes