Bandwidth kernel dalam estimasi kepadatan kernel


10

Saya melakukan beberapa estimasi kepadatan Kernel, dengan titik-titik tertimbang yang ditetapkan (mis., Masing-masing sampel memiliki bobot yang tidak diperlukan), dalam dimensi N. Juga, sampel ini hanya dalam ruang metrik (mis., Kita dapat menentukan jarak di antara mereka) tetapi tidak ada yang lain. Sebagai contoh, kita tidak dapat menentukan rata-rata titik sampel, atau standar deviasi, atau skala satu variabel dibandingkan yang lain. Kernel hanya dipengaruhi oleh jarak ini, dan berat masing-masing sampel:

f(x)=1.wesayaghtssayawesayaghtsayahKernel(dsayastSebuahnce(x,xsaya)h)

Dalam konteks ini, saya mencoba untuk menemukan estimasi yang kuat untuk bandwidth kernel , mungkin bervariasi secara spasial, dan lebih disukai yang memberikan rekonstruksi yang tepat pada dataset pelatihan . Jika perlu, kita dapat mengasumsikan bahwa fungsinya relatif lancar.hxsaya

Saya mencoba menggunakan jarak ke tetangga terdekat pertama atau kedua tetapi hasilnya cukup buruk. Saya mencoba dengan optimisasi satu-keluar, tetapi saya kesulitan menemukan ukuran yang baik untuk dioptimalkan dalam konteks ini di Nd, sehingga ia menemukan perkiraan yang sangat buruk, terutama untuk sampel pelatihan itu sendiri. Saya tidak bisa menggunakan estimasi serakah berdasarkan asumsi normal karena saya tidak bisa menghitung standar deviasi. Saya menemukan referensi menggunakan matriks kovarians untuk mendapatkan kernel anisotropik, tetapi sekali lagi, itu tidak akan bertahan di ruang ini ...

Seseorang punya ide atau referensi?


Jika Anda bisa mengukur jarak, maka Anda bisa mengukur rerata. Apakah itu benar? Saya mungkin mengatakan "Saya menggunakan jarak cosinus untuk kata-kata" jadi "kata yang berarti tidak benar-benar memiliki banyak arti", tetapi saya tidak melihat mengapa itu masih tidak dapat dihitung. Anda bisa mengatakan bahwa Anda berada dalam ruang ordinal, jadi nilai tengahnya tidak terus menerus dihargai. Mengapa rata-rata tidak dapat didefinisikan?
EngrStudent

Jawaban:



2

Di Matlab File Exchange, ada fungsi kde yang menyediakan bandwidth optimal dengan asumsi bahwa kernel Gaussian digunakan: Kernel Density Estimator .

Bahkan jika Anda tidak menggunakan Matlab, Anda dapat menguraikan kode ini untuk metode penghitungan bandwidth optimal. Ini adalah fungsi yang sangat berperingkat pada pertukaran file dan saya telah menggunakannya berkali-kali.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.