Bagaimana saya bisa mengubah pengucapan Alexa dari kata tertentu dalam suatu keterampilan?

Terkadang, ketika mengembangkan keterampilan Alexa dan memprogram tanggapan dari layanan saya, Alexa salah mengucapkan kata-kata dalam jawaban saya, membingungkan pengguna.

Misalnya, jika saya ingin Alexa mengatakan sepatah kata dalam bahasa yang berbeda (mungkin untuk keterampilan belajar bahasa), bagaimana saya bisa memberi tahu Alexa bagaimana cara mengucapkan kata itu dengan benar, alih-alih menerapkan aturan pelafalan bahasa Inggris?

Ini juga berlaku untuk kata-kata bahasa Inggris dengan pengucapan yang aneh; Adakah cara untuk mendikte Alexa pengucapan yang benar, atau menggantinya dengan suara kustom yang benar? Apakah saya perlu menggunakan markup tambahan atau panggilan API?

alexa

— Aurora0001
sumber

Alexa mendukung SSML , yang merupakan bahasa markup XML untuk pidato. Alih-alih mengembalikan teks biasa dari layanan Anda, Anda dapat menggunakan respons SSML. The <phoneme>tag adalah apa yang Anda butuhkan khususnya:

fonem

Memberikan pelafalan fonemik / fonetis untuk teks yang terkandung. Misalnya, orang mungkin mengucapkan kata-kata seperti "kemiri" secara berbeda.

Untuk kata-kata bahasa Inggris (terutama bahasa Inggris AS), Alexa harus dapat mengucapkan kata apa pun jika Anda memberikan pengucapan fonetik yang benar:

Tabel berikut mencantumkan simbol yang didukung untuk digunakan dengan tag fonem. Simbol-simbol ini memberikan cakupan penuh untuk suara-suara bahasa Inggris AS. Perhatikan bahwa banyak bahasa non-Inggris memerlukan penggunaan simbol yang tidak termasuk dalam daftar ini, yang tidak didukung. Penggunaan simbol yang tidak termasuk dalam daftar ini tidak disarankan, karena dapat menghasilkan sintesis ucapan yang kurang optimal.

^{Kutipan dari dokumentasi Amazon di SSML.}

Berikut adalah contoh pemberian Alexa pengucapan khusus:

<speak>
    <phoneme alphabet="ipa" ph="hɛˈləʊ̯">Hello</phoneme>.
    <phoneme alphabet="ipa" ph="bɔ̃.ˈʒuʁ">Bonjour</phoneme>.
</speak>

The <phoneme>tag mendukung IPA dan X-SAMPA abjad fonetik. Anda biasanya dapat menemukan ejaan IPA untuk kata apa pun di Wiktionary atau melalui Google.

Untuk pesan yang lebih lama, mungkin yang terbaik adalah menggunakan <audio>tag dan merekam suara khusus:

Tag audio memungkinkan Anda memberikan URL untuk file MP3 yang dapat diputar layanan Alexa saat memberikan respons. Anda dapat menggunakan ini untuk menyematkan audio pendek, yang sudah direkam sebelumnya dalam respons layanan Anda. Misalnya, Anda dapat memasukkan efek suara di samping respons text-to-speech Anda, atau memberikan respons menggunakan suara yang terkait dengan merek Anda.

^{Dikutip dari dokumentasi Amazon pada <audio>.}

— Aurora0001
sumber