Pemrosesan sinyal speech-recognition

3

Adakah yang tahu filter untuk menipiskan non-ucapan? Saya menulis perangkat lunak pengenal ucapan dan ingin menyaring semuanya kecuali ucapan manusia. Ini akan mencakup kebisingan latar belakang, kebisingan yang dihasilkan oleh mikrofon yang jelek, atau bahkan musik latar. Saya sudah menerapkan filter urutan pertama yang mengkompensasi roll-off 6 dB dari spektrum …

17 filters audio noise speech-recognition

1

Menentukan seberapa mirip audio dengan ucapan manusia

Sambil mencari jawaban untuk masalah ini, saya menemukan papan ini jadi memutuskan untuk mengirim pertanyaan saya dari Stack Overflow. Saya mencari metode untuk menentukan kesamaan antara segmen audio dan suara manusia, yang diekspresikan secara numerik. Saya telah mencari sedikit, tetapi apa yang saya temukan sejauh ini (terperinci di bawah) tidak …

12 audio algorithms speech-recognition

1

Apa perbedaan reduksi untuk pengenalan wicara berbeda dari reduksi noise yang seharusnya membuat wicara lebih “dapat dipahami” bagi manusia?

ini adalah pertanyaan yang membuat saya tertarik untuk beberapa waktu sekarang, terutama karena saya sedang mengerjakan pengurangan kebisingan untuk sistem pengenalan ucapan yang ada. Sebagian besar makalah tentang teknik pengurangan kebisingan tampaknya berfokus pada bagaimana membuat bicara lebih dapat dipahami oleh manusia, atau bagaimana meningkatkan istilah yang tidak jelas seperti …

10 noise speech-recognition speech-processing noise-cancellation

1

Merancang vektor fitur untuk membedakan berbagai bentuk gelombang sonik

Pertimbangkan 4 sinyal gelombang berikut: signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607] signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124] signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 164.2109 160.3817 164.5383 171.8134 …

10 computer-vision frequency-spectrum autocorrelation speech-recognition

1

Bagaimana cara membagi audio panggilan telepon menjadi hening / tidak hening?

Masalah saya adalah bahwa saya tidak tahu energi dari kebisingan latar belakang, jadi saya tidak bisa hanya membatasi energi. Pemrosesan dilakukan secara real time, dan saya memiliki sekitar 500 msec untuk memutuskan. Idealnya, saya ingin konsonan yang tenang dianggap tidak diam.

9 audio speech-recognition

2

Bagaimana menerapkan transformasi Hough berbasis gradien

Saya mencoba menggunakan transformasi Hough untuk deteksi tepi, dan ingin menggunakan gambar gradien sebagai dasarnya. Apa yang telah saya lakukan sejauh ini, mengingat gambar Idari ukuran [M,N]dan derivatif parsial nya gx, gy, adalah untuk menghitung sudut gradien di setiap pixel sebagai thetas = atan(gy(x,y) ./ gx. Demikian pula saya menghitung …

9 image-processing edge-detection image-processing computer-vision image-registration discrete-signals noise bpsk snr demodulation bpsk multipath synchronization timing image-processing filters algorithms edge-detection sampling demodulation bpsk synchronization timing fft fourier-transform delay audio speech-recognition soft-question discrete-signals discrete-signals autocorrelation frequency computer-vision

3

Bagaimana Siri mengenali saya dengan mengatakan "Hai Siri"?

Saya mencoba untuk memahami bagaimana iPhone saya dapat terus mendengarkan saya mengatakan Hey Siri, Alexa, Hey Cortanaatau Okay Googletanpa cepat menguras baterai saya turun. Saya membayangkan dua jenis algoritma. Satu yang merekam irisan waktu seperti irisan lebar 10 ms setiap 200 ms dan melakukan deteksi sinkron pada frekuensi tertentu. Namun …

8 sound speech-recognition voice

2

Apa arti "vektor" dalam model Markov tersembunyi?

Saya tahu bahwa Model Markov Tersembunyi (HMM) digunakan dalam pengenalan ucapan dan memahaminya sampai batas tertentu. Namun, yang saya tidak tahu adalah bagaimana input (ucapan) "ditransformasikan" menjadi vektor yang kemudian digunakan dalam HMM. Bagaimana Anda mendapatkan vektor dari input suara? Apakah vektor ini dapat dibaca oleh manusia?

8 speech-recognition

Pertanyaan yang diberi tag «speech-recognition»