Sintesis ucapan yang membutuhkan kinerja CPU sangat sedikit?


13

Kembali pada hari-hari 1 MHz 8-bit CPU komputer pribadi (Apple II, Atari 800, et.al.), ada program perangkat lunak yang dapat melakukan sintesis teks-ke-bicara sewenang-wenang yang dapat dipahami pada PC tersebut. Algoritme sintesis wicara yang dipublikasikan apa yang cocok untuk implementasi pada pengontrol mikro dengan kinerja dan memori yang terbatas? (Jika ada...)


Tidak tahu bagaimana mereka melakukannya, tetapi ini adalah IC allophone-to-audio yang disebut SpeakerJet dan inilah generator text-to-allophone yang terkait. Anda mungkin bertanya kepada orang-orang di speakjet.com bagaimana mereka melakukannya ...
Kevin Vermeer

@KevinVermeer - Mengapa Anda tidak memposting ini sebagai jawaban? Anda akan mendapat dukungan dari saya setidaknya karena itu akan menjadi pelengkap yang sangat baik untuk jawaban saya sendiri.
Mark Booth

Jawaban:


3

Metode yang saya mainkan pada komputer rumahan 8-bit pada tahun 80-an yang terlibat memiliki satu set kecil sampel fonetik dan kemudian memiliki teks yang ingin Anda bicarakan didefinisikan dalam hal sampel tersebut.

Karena saya tidak tahu tentang IPA pada saat itu, saya hanya menggunakan dua suara per huruf dan mengalokasikan suara pendek untuk huruf kecil dan suara panjang untuk huruf besar. Ini memang meninggalkan beberapa celah, o untuk / ɒ / ( panas ) dan O untuk / oʊ / ( terbuka ) mudah, tetapi / uː / ( suara oo di bulan ) tidak dapat diwakili dalam sistem saya, yang adalah masalah bagi saya, mengingat nama saya (/ BUD / sajak dengan / smuːð /, coba mereka di Itinerarium s sintesis fonem halaman web).

Hari-hari ini, Anda bisa melakukan lebih banyak hal pintar. Sebagai permulaan, Anda bisa menggunakan teknik pencarian untuk menerjemahkan kata-kata yang dikenal dalam teks ortografis ke dalam simbol fonetis Anda yang dikenal , dan untuk kata-kata yang tidak diketahui, menerapkan Fonics sebagai suatu algoritma harus melakukan pekerjaan yang masuk akal.

Setelah mendapatkan aliran fonetis Anda, Anda mungkin dapat menggunakan teknik DMA untuk mengalirkan masing-masing sampel fonem dari memori ke DAC Anda, dengan lebih sedikit overhead ke CPU Anda.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.