Tampaknya ada dua pertanyaan berbeda di sini, yang akan saya coba bagi:
1) bagaimana KS, perataan kernel, berbeda dengan KDE, estimasi kepadatan kernel? Nah, katakan saya punya estimator / lebih halus / interpolator
est( xi, fi -> gridj, estj )
dan kebetulan juga mengetahui densitas "nyata" () di xi. Maka menjalankan
est( x, densityf )
harus memberikan estimasi densityf (): a KDE. Mungkin saja KS dan KDE dievaluasi secara berbeda - kriteria kelancaran yang berbeda, norma yang berbeda - tetapi saya tidak melihat perbedaan mendasar. Apa yang saya lewatkan?
2) Bagaimana dimensi memengaruhi estimasi atau perataan, secara intuitif ? Ini contoh mainan, hanya untuk membantu intuisi. Pertimbangkan kotak N = 10.000 poin dalam kotak seragam, dan jendela, garis atau kotak atau kubus, dari W = 64 poin di dalamnya:
1d 2d 3d 4d
---------------------------------------------------------------
data 10000 100x100 22x22x22 10x10x10x10
side 10000 100 22 10
window 64 8x8 4x4x4 2.8^4
side ratio .64 % 8 % 19 % 28 %
dist to win 5000 47 13 7
Di sini "rasio sisi" adalah sisi jendela / sisi kotak, dan "dist to win" adalah perkiraan kasar dari jarak rata-rata titik acak dalam kotak ke jendela yang ditempatkan secara acak.
Apakah ini masuk akal sama sekali? (Gambar atau applet akan sangat membantu: siapa pun?)
Idenya adalah bahwa jendela ukuran tetap dalam kotak ukuran tetap memiliki kedekatan yang sangat berbeda dengan kotak lainnya, dalam 1d 2d 3d 4d. Ini untuk kisi yang seragam; mungkin ketergantungan yang kuat pada dimensi membawa ke distribusi lain, mungkin tidak. Bagaimanapun, ini terlihat seperti efek umum yang kuat, suatu aspek dari kutukan dimensi.