Ada sejumlah penaksir skala yang kuat . Contoh penting adalah deviasi absolut median yang berhubungan dengan deviasi standar sebagai . Dalam kerangka kerja Bayesian ada sejumlah cara untuk memperkirakan dengan kuat lokasi distribusi yang kira-kira normal (misalnya, Normal yang terkontaminasi oleh pencilan), misalnya, dapat diasumsikan bahwa data didistribusikan sebagai distribusi atau distribusi Laplace. Sekarang pertanyaan saya:
Akan seperti apa model Bayesian untuk mengukur skala distribusi normal dengan cara yang kuat, kuat dalam arti yang sama dengan MAD atau penduga kuat yang serupa?
Seperti halnya dengan MAD, akan lebih rapi jika model Bayesian dapat mendekati SD dari distribusi normal dalam kasus ketika distribusi data sebenarnya terdistribusi normal.
edit 1:
Sebuah contoh khas dari model yang kuat terhadap kontaminasi / outlier ketika asumsi data adalah kira-kira normal menggunakan di distribusi seperti:
Di mana adalah mean, adalah skalanya, dan adalah derajat kebebasan. Dengan prior yang sesuai pada dan , akan menjadi perkiraan rata-rata yang akan kuat terhadap outlier. Namun, tidak akan menjadi estimasi yang konsisten dari SD karena tergantung pada . Misalnya, jika akan diperbaiki ke 4.0 dan model di atas akan dipasang ke sejumlah besar sampel dari distribusi maka akan menjadi sekitar 0,82. Yang saya cari adalah model yang kuat, seperti model t, tetapi untuk SD alih-alih (atau sebagai tambahan) artinya.
edit 2:
Berikut mengikuti contoh kode dalam R dan JAGS tentang bagaimana model-t yang disebutkan di atas lebih kuat sehubungan dengan mean.
# generating some contaminated data
y <- c( rnorm(100, mean=10, sd=10),
rnorm(10, mean=100, sd= 100))
#### A "standard" normal model ####
model_string <- "model{
for(i in 1:length(y)) {
y[i] ~ dnorm(mu, inv_sigma2)
}
mu ~ dnorm(0, 0.00001)
inv_sigma2 ~ dgamma(0.0001, 0.0001)
sigma <- 1 / sqrt(inv_sigma2)
}"
model <- jags.model(textConnection(model_string), list(y = y))
mcmc_samples <- coda.samples(model, "mu", n.iter=10000)
summary(mcmc_samples)
### The quantiles of the posterior of mu
## 2.5% 25% 50% 75% 97.5%
## 9.8 14.3 16.8 19.2 24.1
#### A (more) robust t-model ####
library(rjags)
model_string <- "model{
for(i in 1:length(y)) {
y[i] ~ dt(mu, inv_s2, nu)
}
mu ~ dnorm(0, 0.00001)
inv_s2 ~ dgamma(0.0001,0.0001)
s <- 1 / sqrt(inv_s2)
nu ~ dexp(1/30)
}"
model <- jags.model(textConnection(model_string), list(y = y))
mcmc_samples <- coda.samples(model, "mu", n.iter=1000)
summary(mcmc_samples)
### The quantiles of the posterior of mu
## 2.5% 25% 50% 75% 97.5%
##8.03 9.35 9.99 10.71 12.14