Alexa mendukung SSML , yang merupakan bahasa markup XML untuk pidato. Alih-alih mengembalikan teks biasa dari layanan Anda, Anda dapat menggunakan respons SSML. The <phoneme>
tag adalah apa yang Anda butuhkan khususnya:
fonem
Memberikan pelafalan fonemik / fonetis untuk teks yang terkandung. Misalnya, orang mungkin mengucapkan kata-kata seperti "kemiri" secara berbeda.
Untuk kata-kata bahasa Inggris (terutama bahasa Inggris AS), Alexa harus dapat mengucapkan kata apa pun jika Anda memberikan pengucapan fonetik yang benar:
Tabel berikut mencantumkan simbol yang didukung untuk digunakan dengan tag fonem. Simbol-simbol ini memberikan cakupan penuh untuk suara-suara bahasa Inggris AS. Perhatikan bahwa banyak bahasa non-Inggris memerlukan penggunaan simbol yang tidak termasuk dalam daftar ini, yang tidak didukung. Penggunaan simbol yang tidak termasuk dalam daftar ini tidak disarankan, karena dapat menghasilkan sintesis ucapan yang kurang optimal.
Kutipan dari dokumentasi Amazon di SSML.
Berikut adalah contoh pemberian Alexa pengucapan khusus:
<speak>
<phoneme alphabet="ipa" ph="hɛˈləʊ̯">Hello</phoneme>.
<phoneme alphabet="ipa" ph="bɔ̃.ˈʒuʁ">Bonjour</phoneme>.
</speak>
The <phoneme>
tag mendukung IPA dan X-SAMPA abjad fonetik. Anda biasanya dapat menemukan ejaan IPA untuk kata apa pun di Wiktionary atau melalui Google.
Untuk pesan yang lebih lama, mungkin yang terbaik adalah menggunakan <audio>
tag dan merekam suara khusus:
Tag audio memungkinkan Anda memberikan URL untuk file MP3 yang dapat diputar layanan Alexa saat memberikan respons. Anda dapat menggunakan ini untuk menyematkan audio pendek, yang sudah direkam sebelumnya dalam respons layanan Anda. Misalnya, Anda dapat memasukkan efek suara di samping respons text-to-speech Anda, atau memberikan respons menggunakan suara yang terkait dengan merek Anda.
Dikutip dari dokumentasi Amazon pada <audio>
.