Jika minat utama Anda adalah masalah 2-Dimensi, saya akan mengatakan bahwa estimasi kepadatan kernel adalah pilihan yang baik karena memiliki sifat asimptotis yang bagus (perhatikan bahwa saya tidak mengatakan bahwa itu adalah yang terbaik). Lihat misalnya
Parzen, E. (1962). Pada estimasi fungsi dan mode kepadatan probabilitas . Catatan Statistik Matematika 33: 1065-1076.
de Valpine, P. (2004). Monte Carlo menyatakan kemungkinan ruang berdasarkan estimasi kepadatan kernel posterior tertimbang . Jurnal Asosiasi Statistik Amerika 99: 523-536.
Untuk dimensi yang lebih tinggi (4+) metode ini sangat lambat karena kesulitan yang terkenal dalam memperkirakan matriks bandwidth optimal, lihat .
Sekarang, masalah dengan perintah ks
dalam paket KDE
adalah, seperti yang Anda sebutkan, bahwa ia mengevaluasi kepadatan dalam kotak tertentu yang bisa sangat membatasi. Masalah ini dapat diatasi jika Anda menggunakan paket KDE
untuk memperkirakan matriks bandwidth, menggunakan misalnya Hscv
, mengimplementasikan penduga kepadatan Kernel dan kemudian mengoptimalkan fungsi ini menggunakan perintah optim
. Ini ditunjukkan di bawah ini menggunakan data simulasi dan kernel Gaussian di R
.
rm(list=ls())
# Required packages
library(mvtnorm)
library(ks)
# simulated data
set.seed(1)
dat = rmvnorm(1000,c(0,0),diag(2))
# Bandwidth matrix
H.scv=Hlscv(dat)
# [Implementation of the KDE](http://en.wikipedia.org/wiki/Kernel_density_estimation)
H.eig = eigen(H.scv)
H.sqrt = H.eig$vectors %*% diag(sqrt(H.eig$values)) %*% solve(H.eig$vectors)
H = solve(H.sqrt)
dH = det(H.scv)
Gkde = function(par){
return( -log(mean(dmvnorm(t(H%*%t(par-dat)),rep(0,2),diag(2),log=FALSE)/sqrt(dH))))
}
# Optimisation
Max = optim(c(0,0),Gkde)$par
Max
Pengukur bentuk terbatas cenderung lebih cepat, misalnya
Cule, ML, Samworth, RJ dan Stewart, MI (2010). Estimasi kemungkinan maksimum kepadatan log-cekung multi-dimensi . Jurnal Royal Statistical Society B 72: 545–600.
Tetapi mereka terlalu memuncak untuk tujuan ini.
4
Metode lain yang dapat Anda pertimbangkan untuk digunakan adalah: memasang campuran multivariat hingga normals (atau distribusi fleksibel lainnya) atau
Abraham, C., Biau, G. dan Cadre, B. (2003). Perkiraan sederhana dari mode kepadatan multivarian . Jurnal Statistik Kanada 31: 23–34.
Saya harap ini membantu.