Klasifikasi Jenis Vokal Manusia menggunakan MFCC dan Convolutional Neural Network

KRIESNA BAYU PRATAMA

Klasifikasi Jenis Vokal Manusia menggunakan MFCC dan Convolutional Neural Network

KRIESNA BAYU PRATAMA

Informasi Dasar

Klasifikasi Jenis Vokal Manusia menggunakan MFCC dan Convolutional Neural Network

Dilihat

478 kali

No. Katalog

21.04.3190

Klasifikasi

616.855

Jenis katalog

Karya Ilmiah - Skripsi (S1) - Reference

Abstraksi

Jangkauan suara adalah aspek penting yang perlu diketahui oleh seorang penyanyi. Pengetahuan ini diperlukan agar penyanyi dapat memaksimalkan potensi bernyanyinya. Jenis vokal manusia dibagi ke dalam enam kelas yaitu alto, mezzo-soprano dan soprano untuk Wanita dan bass, baritone dan tenor untuk pria. Namun, pada penelitian ini rentang vokal manusia hanya diklasifikasikan ke dalam empat kelas yang biasa digunakan pada paduan suara yaitu, alto (suara rendah untuk wanita), soprano (suara tinggi untuk wanita), bass (suara rendah untuk pria) dan tenor (suara tinggi untuk pria). Penelitian ini menggunakan Mel-frequency Cepstral Coefficient (MFCC) untuk ekstraksi cirinya dan Convolutional Neural Network (CNN) untuk klasifikasinya. Penelitian ini menekankan bagaimana MFCC dan CNN mampu menyelesaikan masalah klasifikasi tipe vokal manusia. Hal ini dibantu oleh WavAugment untuk augmentasi untuk memaksimalkan proses pembelajaran. Dalam penelitian ini, data yang digunakan adalah data primer sehingga data dikumpulkan melalui survei dan eksperimen yang dilakukan langsung oleh peneliti. Data yang digunakan juga mempengaruhi hasil klasifikasi, di mana data harus cukup jarang untuk menghindari model yang overfitted. Hasil performansi paling tinggi didapatkan dari kombinasi fitur ektraksi MFCC dengan Adam Optimizer dengan akurasi pelatihan sebesar 91,83% dan akurasi pengujian sebesar 91,14% dengan durasi 11 menit. Model ini (untuk fitur ekstraktor) mampu mengungguli model yang menggunakan feature extractor Short-Time Fourier Transform (STFT), yang memiliki hasil kompetitif pada beberapa referensi, dengan selisih akurasi pelatihan 3,11% dan akurasi pengujian 1,15%. Selain itu, hasil precision dan recall yang tinggi pada MFCC dengan rata-rata 91% mengindikasikan bahwa model dengan MFCC mampu memberikan prediksi hasil yang akurat. Kajian ini merupakan ilmu multi disiplin yang memiliki pengaruh kuat terhadap musik, khususnya dalam paduan suara. Penelitian ini dilakukan untuk meningkatkan kesinambungan musik paduan suara dan teknologi komputer dengan menggabungkan musik dengan ilmu komputer.