Alasan mengapa kernel Epanechnikov tidak digunakan secara universal untuk optimalitas teoretisnya mungkin karena kernel Epanechnikov sebenarnya tidak optimal secara teoritis . Tsybakov secara eksplisit mengkritik argumen bahwa kernel Epanechnikov "optimal secara teoritis" dalam hal 16-19 dari Pengantar Estimasi Nonparametrik (bagian 1.2.4).
Mencoba meringkas, di bawah beberapa asumsi pada kernel K dan kepadatan tetap p satu memiliki bahwa rata-rata kesalahan kuadrat terintegrasi, dari bentuk
1nh∫K2(u)du+h44S2K∫(p′′(x))2dx.(1)
Kritik utama terhadap Tsybakov tampaknya lebih kecil daripada kernel non-negatif, karena seringkali mungkin untuk mendapatkan penduga yang berkinerja lebih baik, yang bahkan non-negatif, tanpa membatasi ke kernel non-negatif.
Langkah pertama dari argumen untuk kernel Epanechnikov dimulai dengan meminimalkan (1) lebih dari h dan semua kernel non-negatif (daripada semua kernel dari kelas yang lebih luas) untuk mendapatkan bandwidth "optimal" untuk K
hMISE(K)=(∫K2nS2K∫(p′′)2)1/5
dan kernel "optimal" (Epanechnikov)
K∗(u)=34(1−u2)+
yang berarti kesalahan kuadrat terintegrasi adalah:
hMISE(K∗)=(15n∫(p′′)2)1/5.
Namun ini bukan pilihan yang layak, karena mereka bergantung pada pengetahuan (melalui p′′ ) dari kepadatan p tidak diketahui - karena itu mereka adalah jumlah "oracle".
Proposisi yang diberikan oleh Tsybakov menyiratkan bahwa MISE asimptotik untuk oracle Epanechnikov adalah:
limn→∞n4/5Ep∫(pEn(x)−p(x))2dx=34/551/54(∫(p′′(x))2dx)1/5.(2)
Tsybakov kata (2) sering diklaim menjadi yang terbaik dicapai MISE, tapi kemudian menunjukkan bahwa seseorang dapat menggunakan kernel dari urutan 2 (untuk yang SK=0 ) untuk membangun estimator kernel, untuk setiap ε>0 , sehingga
lim supn→∞n4/5Ep∫(p^n(x)−p(x))2dx≤ε.
Meskipun p n belum tentu non-negatif, kita masih memiliki hasil yang sama untuk bagian estimator positif, p + n : = max ( 0 , p n ) (yang dijamin untuk menjadi non-negatif bahkan jika K tidak):p^np+n:=max(0,p^n)K
lim supn→∞n4/5Ep∫(p+n(x)−p(x))2dx≤ε.
Oleh karena itu, untuk ε cukup kecil, terdapat penaksir sejati yang memiliki MISE asimptotik yang lebih kecil daripada oracle Epanechnikov , bahkan menggunakan asumsi yang sama pada kerapatan yang tidak diketahui. p .
Khususnya, seseorang memiliki akibat bahwa MISE asimptotik maksimum untuk p tetap atas semua estimator kernel (atau bagian positif dari estimator kernel) adalah0 . Jadi oracle Epanechnikov bahkan tidak mendekati menjadi optimal, bahkan jika dibandingkan dengan penduga sejati.
Alasan mengapa orang mengajukan argumen untuk oracle Epanechnikov di tempat pertama adalah bahwa orang sering berpendapat bahwa kernel itu sendiri harus non-negatif karena kepadatan itu sendiri adalah non-negatif. Tetapi seperti yang Tsybakov tunjukkan, kita tidak perlu berasumsi bahwa kernel adalah non-negatif untuk mendapatkan penduga kepadatan non-negatif, dan dengan membiarkan kernel yang lain kita dapat penduga kepadatan non-negatif yang (1) bukan ramalan. dan (2) tampil sewenang-wenang lebih baik daripada oracle Epanechnikov untuk p tetap . Tsybakov menggunakan perbedaan ini untuk menyatakan bahwa tidak masuk akal untuk berdebat untuk optimal dalam hal p tetap , tetapi hanya untuk properti optimalitas yang seragam di atas kelaskepadatan. Dia juga menunjukkan bahwa argumen masih berfungsi saat menggunakan MSE dan bukan MISE.
EDIT: Lihat juga Konsekuensi 1.1. pada halaman 25, di mana kernel Epanechnikov terbukti tidak dapat diterima berdasarkan kriteria lain. Tsybakov sepertinya tidak menyukai kernel Epanechnikov.
kdensity
.