Pertanyaan yang diberi tag «speech-recognition»

3
filter suara ucapan manusia
Adakah yang tahu filter untuk menipiskan non-ucapan? Saya menulis perangkat lunak pengenal ucapan dan ingin menyaring semuanya kecuali ucapan manusia. Ini akan mencakup kebisingan latar belakang, kebisingan yang dihasilkan oleh mikrofon yang jelek, atau bahkan musik latar. Saya sudah menerapkan filter urutan pertama yang mengkompensasi roll-off 6 dB dari spektrum …

1
Menentukan seberapa mirip audio dengan ucapan manusia
Sambil mencari jawaban untuk masalah ini, saya menemukan papan ini jadi memutuskan untuk mengirim pertanyaan saya dari Stack Overflow. Saya mencari metode untuk menentukan kesamaan antara segmen audio dan suara manusia, yang diekspresikan secara numerik. Saya telah mencari sedikit, tetapi apa yang saya temukan sejauh ini (terperinci di bawah) tidak …

1
Apa perbedaan reduksi untuk pengenalan wicara berbeda dari reduksi noise yang seharusnya membuat wicara lebih “dapat dipahami” bagi manusia?
ini adalah pertanyaan yang membuat saya tertarik untuk beberapa waktu sekarang, terutama karena saya sedang mengerjakan pengurangan kebisingan untuk sistem pengenalan ucapan yang ada. Sebagian besar makalah tentang teknik pengurangan kebisingan tampaknya berfokus pada bagaimana membuat bicara lebih dapat dipahami oleh manusia, atau bagaimana meningkatkan istilah yang tidak jelas seperti …

1
Merancang vektor fitur untuk membedakan berbagai bentuk gelombang sonik
Pertimbangkan 4 sinyal gelombang berikut: signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607] signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124] signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 164.2109 160.3817 164.5383 171.8134 …


2
Bagaimana menerapkan transformasi Hough berbasis gradien
Saya mencoba menggunakan transformasi Hough untuk deteksi tepi, dan ingin menggunakan gambar gradien sebagai dasarnya. Apa yang telah saya lakukan sejauh ini, mengingat gambar Idari ukuran [M,N]dan derivatif parsial nya gx, gy, adalah untuk menghitung sudut gradien di setiap pixel sebagai thetas = atan(gy(x,y) ./ gx. Demikian pula saya menghitung …

3
Bagaimana Siri mengenali saya dengan mengatakan "Hai Siri"?
Saya mencoba untuk memahami bagaimana iPhone saya dapat terus mendengarkan saya mengatakan Hey Siri, Alexa, Hey Cortanaatau Okay Googletanpa cepat menguras baterai saya turun. Saya membayangkan dua jenis algoritma. Satu yang merekam irisan waktu seperti irisan lebar 10 ms setiap 200 ms dan melakukan deteksi sinkron pada frekuensi tertentu. Namun …

2
Apa arti "vektor" dalam model Markov tersembunyi?
Saya tahu bahwa Model Markov Tersembunyi (HMM) digunakan dalam pengenalan ucapan dan memahaminya sampai batas tertentu. Namun, yang saya tidak tahu adalah bagaimana input (ucapan) "ditransformasikan" menjadi vektor yang kemudian digunakan dalam HMM. Bagaimana Anda mendapatkan vektor dari input suara? Apakah vektor ini dapat dibaca oleh manusia?
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.