Pertanyaan yang diberi tag «audio»

Audio, atau dalam hal pemrosesan sinyal, sinyal audio adalah representasi suara analog atau digital, biasanya sebagai tegangan listrik.



4
Perpustakaan untuk Deteksi Aktivitas Suara (Bukan Pengenalan Ucapan)
Sebagai tindak lanjut dari pertanyaan saya sebelumnya, saya bertanya-tanya apakah ada perpustakaan pendeteksi wicara. Dengan deteksi ucapan yang saya maksudkan melewati buffer audio dan mendapatkan kembali indeks di mana pidato dimulai dan berhenti. Jadi jika saya memiliki 10 detik pengambilan sampel audio pada 44kHz, saya akan mengharapkan array angka seperti: …
18 audio  speech 

3
filter suara ucapan manusia
Adakah yang tahu filter untuk menipiskan non-ucapan? Saya menulis perangkat lunak pengenal ucapan dan ingin menyaring semuanya kecuali ucapan manusia. Ini akan mencakup kebisingan latar belakang, kebisingan yang dihasilkan oleh mikrofon yang jelek, atau bahkan musik latar. Saya sudah menerapkan filter urutan pertama yang mengkompensasi roll-off 6 dB dari spektrum …

1
Temukan Musik serupa menggunakan FFT Spectrums
Saya telah bereksperimen beberapa minggu untuk menemukan cara untuk mencocokkan / menemukan Lagu yang serupa di Perpustakaan yang berisi berbagai genre Musik. Percobaan pertama saya adalah untuk Mendeteksi Fitur seperti Tempo atau berapa banyak Bass yang ada di Lagu untuk membentuk grup, tapi saya tidak jauh dengan pendekatan ini (Volume …
16 audio  fft  music 


4
Frekuensi yang lebih rendah lebih kuat di FFT?
Saya menghitung FFT dari input mikrofon. Saya perhatikan bahwa frekuensi yang lebih rendah tampaknya selalu memiliki kekuatan lebih (dB lebih tinggi) daripada frekuensi yang lebih tinggi. Saya memotong data menjadi bingkai 24576 byte (4096 * 6). Terapkan jendela Hamming: input[i] *= (0.54d - 0.46d*(double) Math.Cos((2d*Math.PI*i)/fs)); Jalankan melalui FFTW Process1D(). Konversi …
15 audio  fft 

4
Ekstraksi fitur untuk klasifikasi suara
Saya mencoba mengekstraksi fitur dari file suara dan mengklasifikasikan suara sebagai milik kategori tertentu (misalnya: kulit anjing, mesin kendaraan dll). Saya ingin kejelasan tentang hal-hal berikut: 1) Apakah ini bisa dilakukan? Ada program yang dapat mengenali ucapan, dan membedakan antara berbagai jenis kulit anjing. Tetapi apakah mungkin untuk memiliki program …

1
Mendapatkan kenyaringan trek dengan RMS
Saya mencoba menghitung kenyaringan trek audio yang saya simpan di buffer. Buffer berisi data PCM dari sinyal dan saya ingin mendapatkan seberapa 'keras' itu dengan menggunakan Root Mean Squared. Saya berasumsi saya bisa melakukan ini dalam domain waktu daripada harus beralih ke domain frekuensi. Apa yang akan menjadi kode semu …

2
Kapan lagu laugh kick in?
Salah satu proyek akhir pekan saya telah membawa saya ke kedalaman pemrosesan sinyal. Seperti halnya semua proyek kode saya yang membutuhkan matematika tugas berat, saya lebih dari senang untuk mengotak-atik jalan saya ke solusi meskipun kurangnya landasan teoretis, tetapi dalam hal ini saya tidak memilikinya, dan akan sangat menyukai saran …

4
Cara paling efisien untuk mengekstrak komponen frekuensi dari sinyal audio dengan akurasi mendekati manusia dalam waktu nyata
Saya mencoba mencari cara bagaimana (jika mungkin) untuk mengekstraksi komponen frekuensi dari sampel audio yang sewenang-wenang (biasanya musik) dengan cara seperti FFT, tetapi dalam penelitian saya pada algoritma FFT, saya belajar bahwa ia menderita beberapa pembatasan ketat untuk tujuan ini. Ada 3 masalah yang FFT presentasikan: Karena resolusi bin FFT …

4
Scipy - Pemrosesan Audio
Saya mencari alat yang bagus untuk pemrosesan sinyal Audio. mis. Analisis wicara & musik, identifikasi bahasa otomatis, dll. Apakah perpustakaan Scipy menyediakan fungsi untuk pemrosesan audio? Apakah alat ini baik untuk pemrosesan Sinyal Audio? Bisakah Anda menyarankan alat untuk ini?

2
Desain bandpass filter apa yang akan menghasilkan respons impuls terpendek?
Merancang filter Bpassworth IIR urutan II sederhana dengan frekuensi tengah 500 Hz dan bandwidth 1 oktaf memberi saya respons frekuensi berikut ... Sekarang, jika saya mengambil respon impuls dan menormalkannya dan mengubahnya menjadi dB, kita dapat mengamati pembusukan respon impuls. Pembusukan respon impuls kira-kira linier dengan waktu ketika diplot pada …

5
Identifikasi Tempat Bernyanyi Dimulai dengan Rekaman Suara Saja
Saya memiliki aplikasi bergaya karaoke kecil di mana pengguna menyanyikan 4 baris lagu, dengan jarak satu detik di antara setiap baris. Tidak ada backing musik, jadi itu hanya suara, mudah-mudahan membuat masalah lebih mudah untuk dipecahkan. Saya mencari cara yang paling kuat untuk mendeteksi dengan tepat di mana dalam rekaman …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.