Saya mencoba mendeteksi dan mengklasifikasikan suara non-suara. Saat ini, saya menggunakan serangkaian spektrum daya bergerak yang tumpang tindih dari suara pelatihan sebagai fitur yang saya cari.
Ketika saya melakukan analisis, saya hanya menghitung jumlah spektrum yang tumpang tindih yang sama sehingga jumlah fitur yang sama. Saat ini kinerjanya tidak terlalu baik, itu hanya dapat mendeteksi keheningan vs non-diam.
Teknik apa yang ada untuk jenis deteksi sinyal ini? Salah satu kekhawatiran saya adalah bahwa untuk suara dengan panjang yang berbeda dalam domain waktu akan menghasilkan panjang yang berbeda dari vektor fitur yang jadi saya tidak dapat menggunakan classifier yang sama, saya terjebak dalam hal ini.