Saya melihat sampel kurtosis dari variabel acak yang cukup miring, dan hasilnya tampak tidak konsisten. Untuk sekadar menggambarkan masalahnya, saya melihat contoh kurtosis RV normal log. Dalam R (yang perlahan saya pelajari):
library(moments);
samp_size = 2048;
n_trial = 4096;
kvals <- rep(NA,1,n_trial); #preallocate
for (iii in 1:n_trial) {
kvals[iii] <- kurtosis(exp(rnorm(samp_size)));
}
print(summary(kvals));
Ringkasan yang saya dapatkan adalah
Min. 1st Qu. Median Mean 3rd Qu. Max.
11.87 28.66 39.32 59.17 61.70 1302.00
Menurut Wikipedia , kurtosis untuk RV log-normal ini harus sekitar 114. Jelas sampel kurtosis bias.
Melakukan penelitian saya menemukan bahwa sampel kurtosis bias untuk ukuran sampel kecil. Saya menggunakan estimator 'G2' yang disediakan oleh e1071
paket di CRAN, dan mendapatkan hasil yang sangat mirip untuk ukuran sampel ini.
Pertanyaannya : manakah dari karakter berikut yang mencirikan apa yang terjadi:
- Kesalahan standar dari kurtosis sampel sangat besar untuk RV ini (meskipun perkiraan umum gelombang tangan dari kesalahan standar adalah sesuai urutan). ). Atau, saya menggunakan terlalu sedikit sampel (2048) dalam penelitian ini.
- Implementasi kurtosis sampel ini menderita dari masalah numerik yang dapat diperbaiki dengan metode Terriberry misalnya (dalam banyak cara yang sama bahwa metode Welford memberikan hasil yang lebih baik daripada metode naif untuk varians sampel).
- Saya salah menghitung kurtosis populasi. (Aduh)
- Kurtosis sampel pada dasarnya bias dan Anda tidak pernah dapat memperbaikinya untuk ukuran sampel sekecil itu.
;
di ujung pernyataan Anda. Anda memang melakukan pra-alokasi, tetapi tidak perlu mengisinya NA
, kvals <- numeric(length = n_trial)
sudah cukup. Dengan rep
, Anda hanya perlu argumen 1 dan 3 dari panggilan Anda (mis rep(NA, 10)
.). Dalam pengaturan for
loop, 1:n_trial
bisa berbahaya jika pemrograman; lebih baik seq_along(kvals)
atau seq_len(n_trial)
dalam hal ini. Akhirnya, jika Anda tidak perlu memaksakan pencetakan, jatuhkan print()
putaran summary()
- Anda hanya akan membutuhkannya jika Anda tidak bekerja secara interaktif dengan R. HTH.
print
. Argumen untuk rep
itu tentu saja salah.