SPEECH SYNTHESIZER BERBASIS DIPHONE MENGGUNAKAN ALGORITMA FREQUENCY DOMAIN PITCH SYNCHRONOUS OVERLAP ADD (FD PSOLA)

Aggie Y Prihandi

Informasi Dasar

111050240
621.382 2
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Perkembangan speech processing saat ini meningkat cukup pesat. Berawal dari hasil suara yang didapatkan tidak terdengar alami sama sekali, kemudian menuju ke arah prosodi yang semakin bagus. Speech synthesizer berada pada blok terakhir dalam sistem Text-to-Speech. Speech synthesizer merupakan sebuah sistem yang mampu menghasilkan suara tiruan manusia dengan sintesis ucapan. Metode speech synthesizer yang terdapat saat ini adalah formant synthesis, articulatory synthesis, dan concatenative synthesis.
Metode yang digunakan dalam penyusunan tugas akhir ini menggunakan metode diphone concatenation. Pada awalnya sintesis ucapan dibentuk dengan melakukan perekaman suara, lalu setelah itu hasil yang telah didapat disimpan kedalam database. Kemudian suara rekaman tersebut diurai menjadi beberapa diphone yang merupakan transisi antar dua bunyi yang berdekatan (adjacent phones) sehingga akan lebih stabil ketika dirangkaikan dengan diphone yang lain. Untuk merangkai unit ucapan diphone, maka digunakan algoritma Frequency Domain Pitch Synchronous Overlap-Add (FD PSOLA). Dengan menggunakan algoritma FD PSOLA, proses perangkaian antar diphone yang mengandung transisi antar dua bunyi yang berdekatan (adjacent phones), menjadi halus tanpa bunyi yang bersifat eksplosif.
Dari metode diphone concatenation dan penerapan algoritma FD PSOLA maka sintesis ucapan yang dihasilkan ternyata mendekati suara alami manusia dan dapat dimengerti dengan jelas. Selain itu, algoritma FD PSOLA memberikan kemudahan dalam memodifikasi pitch. Semakin bagus kualitas unit-unit diphone yang terdapat pada database akan memudahkan dalam pembentukan sintesis ucapan, sehingga akan meningkatkan kualitas hasil sintesis.
Kata Kunci : : speech synthesizer, diphone concatenation, pitch, algoritma FD PSOLAABSTRACT: Currently, the development of speech processing rising rapidly. From the voice results obtained does not sound natural at all, then headed toward an increasingly good prosody. Speech synthesizer is on the last block of the Text-to-Speech system. Speech synthesizer is a system that able to produce artificial human voice with speech synthesis. There are some method of speech synthesizer, that is formant synthesis, articulatory synthesis, and concatenative synthesis.
The method used in this final assignment is diphone concatenation method. Speech synthesis was initially formed by the voice recording, then the results are stored in database. Then the voice recording parsed into some of the diphone, that is transition between two adjacent sounds (adjacent phones), that will be more stable when coupled with other diphone. Frequency Domain Pitch Synchronous Overlap-Add (FD PSOLA) algrithm used to assemble the speech diphone unit. By using FD PSOLA algorithm, the process of arranging the inter-containing diphone transition between two adjacent sounds (adjacent phones), became smooth without any noise.
The result that can be obtained from combining diphone concatenation method with FD PSOLA algorithm is sound of speech synthesis more natural and can be clearly understood. In addition, the FD PSOLA algorithm provide an easy way in modifying pitch. The better the quality of diphone units contained in the database will facilitate the formation of speech synthesis and will improve the quality of synthesis results.
Keyword: speech synthesizer, diphone concatenation, pitch, FD PSOLA algorithm.

Subjek

Pengolahan Sinyal Informasi
 

Katalog

SPEECH SYNTHESIZER BERBASIS DIPHONE MENGGUNAKAN ALGORITMA FREQUENCY DOMAIN PITCH SYNCHRONOUS OVERLAP ADD (FD PSOLA)
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Aggie Y Prihandi
Perorangan
Iwan Iwut Tritoasmoro, Gelar Budiman
 

Penerbit

Universitas Telkom
Bandung
2010

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini