Saya melakukan beberapa estimasi kepadatan Kernel, dengan titik-titik tertimbang yang ditetapkan (mis., Masing-masing sampel memiliki bobot yang tidak diperlukan), dalam dimensi N. Juga, sampel ini hanya dalam ruang metrik (mis., Kita dapat menentukan jarak di antara mereka) tetapi tidak ada yang lain. Sebagai contoh, kita tidak dapat menentukan rata-rata titik sampel, atau standar deviasi, atau skala satu variabel dibandingkan yang lain. Kernel hanya dipengaruhi oleh jarak ini, dan berat masing-masing sampel:
Dalam konteks ini, saya mencoba untuk menemukan estimasi yang kuat untuk bandwidth kernel , mungkin bervariasi secara spasial, dan lebih disukai yang memberikan rekonstruksi yang tepat pada dataset pelatihan . Jika perlu, kita dapat mengasumsikan bahwa fungsinya relatif lancar.
Saya mencoba menggunakan jarak ke tetangga terdekat pertama atau kedua tetapi hasilnya cukup buruk. Saya mencoba dengan optimisasi satu-keluar, tetapi saya kesulitan menemukan ukuran yang baik untuk dioptimalkan dalam konteks ini di Nd, sehingga ia menemukan perkiraan yang sangat buruk, terutama untuk sampel pelatihan itu sendiri. Saya tidak bisa menggunakan estimasi serakah berdasarkan asumsi normal karena saya tidak bisa menghitung standar deviasi. Saya menemukan referensi menggunakan matriks kovarians untuk mendapatkan kernel anisotropik, tetapi sekali lagi, itu tidak akan bertahan di ruang ini ...
Seseorang punya ide atau referensi?