Penelitian ini dilakukan bertujuan untuk mengimplementasikan pengenalan pengucapan huruf hijaiyah menggunakan Mel Frequency Cepstral Coefficients (MFCC) dan Bayesian Networks. Dataset yang digunakan berupa hasil rekaman suara dari 6 orang penutur (3 laki-laki dan 3 perempuan) di mana masing-masing penutur membacakan 28 huruf hijaiyah dengan 6 tanda baca. Penelitian ini menganalisa pengaruh model Bayesian Networks, jumlah k pada proses kuansisasi vektor, frame duration, dan frame shift terhadap performansi sistem. MFCC digunakan untuk mengekstrak ciri dari sinyal suara. Hasil ekstraksi ciri kemudian dilakukan kuantisasi vektor untuk mengubah nilai kontinyu menjadi diskrit. Hasil ekstraksi ciri yang telah dilakukan kuantisasi vektor kemudian menjadi masukan pada Bayesian Networks untuk diklasifikasikan. Dari hasil klasifikasi maka dapat diukur performansi sistem dengan menggunakan f1 score. Berdasarkan hasil pengujian, MFCC dan Bayesian Networks mampu menghasilkan performansi yang cukup baik. Model Bayesian Networks yang dipilih serta beberapa parameter ekstraksi ciri MFCC seperti frame duration dan frame shift disimpulkan mempengaruhi performansi sitem. Performansi sistem terbaik adalah dengan f1 score 79,26%.