Klasifikasi usia-gender berdasarkan suara sangat berguna dalam perkenalan pidato dan dalam pengenalan emosi. Klasifikasi gender juga telah diterapkan dalam pengenalan wajah, peringkasan video, penentuan tingkat izin yang berbeda untuk kelompok umur yang berbeda, dan lainnya. Pengelompokan usia yang berbeda dibagi menjadi tiga kelompok: anak, muda, menengah, dan senior berdasarkan rentang usia tertentu. Penelitian ini berfokus pada klasifikasi usia-gender berdasarkan suara pembicara menggunakan gabungan Gaussian Mixture Model dan Hidden Markov Model (GMM-HMM). Pertama, dilakukan pembangunan vektor ciri menggunakan Mel-Frequency Cepstrum Coefficient (MFCC). Selanjutnya, dilakukan pelatihan untuk menghasilkan model akustik untuk semua penutur (pria dan wanita dari berbagai usia) di dalam basisdata pelatihan. Terakhir, HMM diterapkan untuk mendeteksi gender dan kelompok usia. Pada penelitian ini, basisdata suara diambil dari situs Common Voice, yang berisi banyak posting blog, buku-buku lama, film, dan pidato publik lainnya. Hasil eksperimen menunjukkan bahwa model GMM-HMM yang telah dibangun mampu melakukan klasifikasi usia-gender dengan akurasi hingga 96,4%. Model ini dapat diperbaiki dengan pengaturan parameter secara lebih presisi dan penggunaan dataset yang lebih besar.