Masalah saya adalah bahwa saya tidak tahu energi dari kebisingan latar belakang, jadi saya tidak bisa hanya membatasi energi. Pemrosesan dilakukan secara real time, dan saya memiliki sekitar 500 msec untuk memutuskan. Idealnya, saya ingin konsonan yang tenang dianggap tidak diam.
6
Saya tidak memiliki informasi yang cukup untuk memberikan jawaban lengkap, tetapi masalah Anda disebut sebagai deteksi aktivitas suara . Tidak ada satu pun cara terbaik yang disepakati untuk melakukannya, dan jika Anda melihat Anda mungkin akan menemukan banyak pendekatan yang berbeda. Mungkin beberapa yang lain dapat menyempurnakannya sedikit lebih banyak.
—
Jason R
@Michael Litvin, ada kelas filter non-linear (digunakan dalam 'deteksi energi' dengan nama 'Teager-Kaiser'. Saya pikir itu adalah subset dari apa yang dikenal sebagai 'kernel voltera'. Maaf saya tidak dapat memberikan apapun lebih banyak informasi, tetapi jika Anda mencari-cari kata-kata itu, Anda mungkin menemukan apa yang Anda cari. Saya tahu bahwa metode Teager-Kaiser digunakan untuk 'ketika' suara paus mulai VS hanya suara latar belakang.
—
Spacey