ABSTRAKSI: Data mining merupakan proses untuk memperoleh informasi pada suatu data, sehingga dapat diambil manfaat dari data tersebut. Terdapat beberapa proses dalam data mining, salah satunya klasifikasi. Voting feature intervals (VFI) merupakan salah satu classifier pada data mining. Model pada VFI dibangun dengan interval dan kelas. Interval pada VFI dibentuk di setiap atribut berdasarkan nilai atribut itu sendiri. Setelah terbentuk interval, kelas dihitung pada tiap-tiap interval.
Grafem to fonem atau Grapheme to Phoneme (G2P), adalah data kata dan cara baca dari kata tersebut. Dengan adanya model, maka dapat dilakukan prediksi cara baca suatu kata (mencari nilai fonem). Dataset diambil dari Kamus Besar Bahasa Indonesia (KBBI) ditambah dengan kata sehari-hari, sehingga software diharapkan dapat belajar kata-kata berimbuhan.
Berdasarkan hasil penelitian pada Tugas Akhir ini, VFI mempunyai waktu tercepat dalam pembentukan model dan nilai akurasi yang cukup tinggi dibanding dengan metode yang lain.
Kata Kunci : Kata kunci : mining, interval, VFI, G2P, waktu, akurasiABSTRACT: Data Mining is a process of obtaining information from a data of which can be used for other benefit. There are several processes of Data Mining, one of them is classification.
Voting Feature Intervals (VFI) is one of the classifier in Data Mining. The model within VFI is built by intervals and classes. The interval of VFI is formed at every attribute based on the value of attribute itself. After an interval is made, classes will be counted on every interval.
Grapheme to Phoneme (G2P) is a word data and pronouncing method of a specific word. By using the model, the pronouncing method of a word can be predicted (finding the value of the phoneme). The dataset is taken from Kamus Besar Bahasa Indonesia (The Great Dictionary of Indonesian Language) with some additional from daily words, thus software is expected to learn words with prefixes and suffixes.
Based on the research on this Final Project, VFI has the most efficient time in making the model and has a quite high accuracy compared with other method.
Keyword: Keywords : mining, intervals, VFI, G2P, time, accuracy