Konversi grafem ke fonem atau fonemisasi adalah salah satu preprocessing yang banyak digunaka terlebih pada bidang pengenalan suara. Penelitian ini bertujuan untuk meningkatkan performa dari penelitian sebelumnya yang memiliki kesulitan dalam mengatasi kata dengan awalan ’ber, ’me’, ’per’, dan ’ter’ dimana huruf pada kata tersebut terkadang salah dikonversi. Pada penelitian ini stemming dilakukan agar mengurangi error tersebut, metode yang digunakan adalah Fuzzy Nearest Neighbor (FNN) dengan menggunakan Phonemic Rule, dan Modified Grapheme Encoding. Metode evaluasi yang digunakan adalah 5-fold cross-validation dengan hasil Phoneme Error Rate (PER) sebesar 0.97% dan Word Error Rate (WER) sebesar 7.02%. Hasil yang didapat tidak lebih baik dibandingkan dengan penelitian sebelumnya, hal ini diakibatkan banyanya kesalahan dalam mengkonversi garfem dan juga imbuhan awal ’ter’.