Pengamatan bahwa dalam contoh yang melibatkan data yang diambil dari distribusi Gaussian yang terkontaminasi, Anda akan mendapatkan estimasi yang lebih baik dari parameter yang menggambarkan sebagian besar data dengan menggunakan bukan med | x - med ( x ) | dimana mad ( x )madmed|x−med(x)|mad(x) adalah:
mad=1.4826×med|x−med(x)|
--di mana, adalah faktor konsistensi yang dirancang untuk memastikan bahwa E ( mad ( x ) 2 ) = Var ( x )
ketika x tidak terkontaminasi - pada awalnya dibuat oleh Gauss (Walker , H. (1931)).(Φ−1(0.75))−1=1.4826
E(mad(x)2)=Var(x)
x
Saya tidak bisa memikirkan alasan untuk tidak menggunakan sebagai ganti mean sampel dalam kasus ini. Efisiensi yang lebih rendah (di Gaussian!) Dari orang gila bisa menjadi alasan untuk tidak menggunakan orang gila dalam contoh Anda. Namun, ada alternatif yang sama kuat dan sangat efisien untuk orang gila . Salah satunya adalah Q nmedmadmadmadQn. Penaksir ini memiliki banyak keunggulan lain di samping. Ini juga sangat tidak sensitif terhadap outlier (bahkan hampir sama tidak sensitifnya dengan orang gila). Berlawanan dengan orang gila, itu tidak dibangun di sekitar perkiraan lokasi dan tidak berasumsi bahwa distribusi bagian data yang tidak terkontaminasi adalah simetris. Seperti orang gila, ini didasarkan pada statistik pesanan, sehingga selalu didefinisikan dengan baik bahkan ketika distribusi yang mendasari sampel Anda tidak memiliki momen. Seperti orang gila, Ia memiliki bentuk eksplisit yang sederhana. Bahkan lebih daripada untuk orang gila, saya tidak melihat alasan untuk menggunakan standar deviasi sampel daripada pada contoh yang Anda jelaskan (lihat Rousseeuw dan Croux 1993 untuk info lebih lanjut tentang Q nQnQn ).
x∼Γ(ν,λ)
med(x)≈λ(ν−1/3)
dan
mad(x)≈λν−−√
ν>1.5
ν^=(med(x)mad(x))2
dan
λ^=mad(x)2med(x)
Lihat Chen dan Rubin (1986) untuk derivasi lengkap.
- J. Chen dan H. Rubin, 1986. Batas untuk perbedaan antara median dan rata-rata distribusi Gamma dan Poisson, Statist. Mungkin. Lett., 4, 281–283.
- PJ Rousseeuw dan C. Croux, 1993. Alternatif untuk Median Absolute Deviation Journal dari American Statistics Association, Vol. 88, No. 424, hlm. 1273-1283
- Walker, H. (1931). Studi dalam Sejarah Metode Statistik. Baltimore, MD: Williams & Wilkins Co. hlm. 24–25.