Variabilitas yang menyusut ketika N meningkat adalah variabilitas mean sampel, sering dinyatakan sebagai kesalahan standar. Atau, dalam istilah lain, kepastian kebenaran rata-rata sampel meningkat.
Bayangkan Anda menjalankan eksperimen di mana Anda mengumpulkan 3 pria dan 3 wanita dan mengukur ketinggian mereka. Seberapa yakin Anda bahwa ketinggian rata-rata dari setiap kelompok adalah rata-rata sebenarnya dari populasi pria dan wanita yang terpisah? Saya harus berpikir bahwa Anda tidak akan terlalu yakin sama sekali. Anda dapat dengan mudah mengumpulkan sampel baru 3 dan menemukan cara baru beberapa inci dari yang pertama. Cukup banyak percobaan berulang seperti ini bahkan bisa mengakibatkan wanita dinyatakan lebih tinggi daripada pria karena caranya akan sangat bervariasi. Dengan N rendah Anda tidak memiliki banyak kepastian dalam mean dari sampel dan itu sangat bervariasi di seluruh sampel.
Sekarang bayangkan 10.000 pengamatan di setiap kelompok. Akan sangat sulit untuk menemukan 10.000 sampel baru yang memiliki cara yang sangat berbeda satu sama lain. Mereka akan jauh lebih sedikit variabel dan Anda akan lebih yakin akan keakuratannya.
Jika Anda dapat menerima pemikiran ini maka kami dapat memasukkannya ke dalam perhitungan statistik Anda sebagai kesalahan standar. Seperti yang Anda lihat dari persamaannya, ini merupakan estimasi parameter, (yang seharusnya menjadi lebih akurat ketika n bertambah) dibagi dengan nilai yang selalu meningkat dengan n, . Kesalahan standar itu mewakili variabilitas cara atau efek dalam perhitungan Anda. Semakin kecil, semakin kuat uji statistik Anda.√σn−−√
Berikut adalah sedikit simulasi dalam R untuk menunjukkan hubungan antara kesalahan standar dan standar deviasi dari banyak banyak ulangan percobaan awal. Dalam hal ini kita akan mulai dengan rata-rata populasi 100 dan standar deviasi 15.
mu <- 100
s <- 50
n <- 5
nsim <- 10000 # number of simulations
# theoretical standard error
s / sqrt(n)
# simulation of experiment and the standard deviations of their means
y <- replicate( nsim, mean( rnorm(n, mu, s) ) )
sd(y)
Perhatikan bagaimana standar deviasi akhir dekat dengan kesalahan standar teoritis. Dengan bermain dengan variabel n di sini Anda dapat melihat ukuran variabilitas akan semakin kecil dengan meningkatnya n.
[Sebagai tambahan, kurtosis dalam grafik tidak benar-benar berubah (dengan asumsi mereka adalah distribusi normal). Menurunkan varians tidak mengubah kurtosis tetapi distribusinya akan terlihat lebih sempit. Satu-satunya cara untuk memeriksa perubahan kurtosis secara visual adalah menempatkan distribusi pada skala yang sama.]