Standar deviasi kerataan spektral - jadi apa yang saya ukur, secara konseptual?


8

Dalam pencarian saya yang tak berkesudahan untuk mengidentifikasi dengkuran, saya telah menemukan bahwa "kerataan spektral" tampaknya menjadi ukuran yang adil dari sinyal "kualitas".

Saya menghitung kerataan spektral sebagai rata-rata geometris dari data daya FFT dibagi dengan rata-rata aritmatika dari titik yang sama.(R2+I2)

Saya kemudian (sedikit twist di sini) menghitung komputasi rata-rata aritmatika berjalan (lebih dari 50 frame) dan deviasi standar dari kerataan spektral dan menghitung deviasi standar "dinormalisasi" sebagai standar deviasi berjalan dibagi dengan rata-rata berjalan.

Untuk sampel saya, saya menemukan bahwa metrik ini lebih besar dari sekitar (berkisar hingga atau lebih) ketika audio "baik" (yaitu, saya memiliki pelacakan yang dapat diandalkan dari suara pernapasan / dengkuran subjek tidur) dan umumnya tergelincir ke bawah di bawah ketika audio "di lumpur". (Saya bisa memperbaiki diskriminasi ini dengan menggunakan ambang batas yang bergerak dengan faktor-faktor lain, tapi itu mungkin topik yang berbeda.) Saya juga mengamati bahwa ukurannya lebih dari ketika ada suara latar yang substansial (misalnya, seseorang memasuki ruangan dan berbisik tentang ).0.20.50.21.0

Jadi, pertanyaan dasar saya adalah: Apakah ada nama (di luar "standar deviasi standar kerataan spektral") untuk apa yang saya ukur, dan adakah yang bisa memberikan penjelasan konseptual tentang apa arti "metrik" metrik?

(Saya sudah mencoba selusin metrik lainnya untuk sinyal "kualitas", dan yang ini tampaknya yang terbaik hingga saat ini.)

Ditambahkan: Saya mungkin harus mengakui bahwa saya tidak memiliki pegangan konseptual yang sangat baik tentang apa yang diukur rata kerataan spektral (hanya artikel Wikipedia ), jadi penjelasan lebih lanjut tentang itu akan dihargai.


2
Jadi Anda membuat perhitungan dan bertanya apakah ada orang lain yang memiliki ide yang sama dan menamainya, dan jika tidak, dapatkah seseorang membuat penjelasan konseptual untuk apa yang telah Anda buat? Tentunya Anda harus memiliki alasan untuk memasukkan "putaran kecil" Anda, atau apakah Anda, seperti Indiana Jones, hanya mengada-ada saat Anda melanjutkan?
Dilip Sarwate

3
Saya pada dasarnya hanya mengada-ada saat saya melanjutkan. Saya menemukan teknik, menerapkannya pada data, mengamati hasilnya, dan memutuskan apakah itu berguna. Jika demikian, saya mencoba perbaikan. Ini adalah proses yang membosankan, tetapi "pakar" analisis audio yang mengerjakan proyek ini memutuskan dan pulang.
Daniel R Hicks

Jawaban:


4

Karena Anda tertarik pada "flatness" dari spektrum Anda, pada kenyataannya, Anda tertarik pada seberapa dekat sinyal Anda dengan white noise (yang secara definisi memiliki spektrum datar + fase acak). Jika Anda mundur, salah satu ukuran adalah "jarak" pengamatan Anda ke referensi white noise .

Ukuran yang jelas dalam hal teori informasi adalah perbedaan Kullback-Leibler . Anda tidak perlu memahami setiap bagiannya, tetapi ia mengukur dalam bit (jika Anda menggunakan basis log 2) jarak antara kedua distribusi.

Hal yang baik dalam kasus Anda adalah bahwa referensi Anda datar, sehingga yang tersisa adalah entropi spektrum Anda . Ada banyak implementasi yang ada (misalnya dalam scipy ).

Perhatikan bahwa Anda masih berada di sisi yang aman: jika distribusi Anda mendekati gaussian, kedua ukuran (entropi dan std) akan proporsional. Entropi itu lebih umum dan lebih berprinsip. Sebagai ekstensi, Anda akan dapat menggeneralisasi ke jenis suara lain (misalnya 1 / f).


Yang aneh adalah bahwa entropi "biasa" - jumlah p log p- tampaknya tidak menyampaikan banyak informasi untuk masalah saya. (Meskipun saya kira saya tidak mencoba mengambil standar deviasi itu.)
Daniel R Hicks

3

Setiap perbedaan konsisten yang dapat diandalkan dalam statistik sinyal Anda (atau beberapa fungsi sinyal Anda, seperti spektrumnya) dan kebisingan di mana sinyal Anda disematkan dapat digunakan untuk memperkirakan probabilitas satu terhadap yang lain.

Anda tampaknya telah menemukan (salah satu) secara acak salah satu dari sejumlah cara yang mungkin tak terbatas untuk mengkarakterisasi bentuk spektrum sinyal yang membedakan sinyal yang Anda inginkan dari hal-hal yang lebih mirip white noise atau paku impuls. Tersandung pada solusi acak yang mungkin mati tidak membatalkannya (itulah salah satu dasar pemrograman evolusioner / genetik). Tetapi seberapa kuat ukuran yang Anda temukan dibiarkan sebagai latihan eksperimental.


Masalahnya, langkah-langkah lain, seperti entropi teratur, belum menunjukkan janji sebanyak langkah ini. Jika saya bisa mengerti mengapa yang ini tampak lebih baik saya mungkin bisa memperbaikinya.
Daniel R Hicks

hotpaw2, Anda menyebutkan beberapa cara lain yang ada di mana seseorang dapat membedakan antara sinyal dan kebisingan - atau 'ukuran' dari bentuk spektrum magnitudo FFT - cara apa yang ada persis yang muncul di pikiran?
Spacey

Tepat muncul dalam benak ??? Algoritma pencarian jenis evolusi / genetik / Hadoop kadang-kadang dikatakan untuk menambang barang, dari data yang cukup, dari "bentuk" yang tidak terpikirkan atau biasanya digambarkan sebagai tepat, sampai mungkin setelah fakta.
hotpaw2

@ hotpaw2 Maaf, mungkin pertanyaan saya tidak jelas - Saya hanya ingin tahu apa cara sederhana untuk mengukur, katakan, 'puncaknya' mungkin ada, (sebagai contoh bagaimana spektrum terlihat). Tidak bertanya tentang sesuatu yang terlalu mewah, meskipun metode pembelajaran tanpa pengawasan yang Anda sebutkan itu pasti kuat.
Spacey
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.