Jika Anda mendefinisikan varians sebagai s2n=MSE=1n∑ni=1(xi−x¯)2- mirip dengan varians populasi tetapi dengan mean sampel untukμ, maka kedua sampel Anda akan memiliki varians yang sama.
Jadi perbedaannya adalah murni karena koreksi Bessel dalam formula biasa untuk varian sampel ( s2n−1=nn−1⋅MSE=nn−1⋅1n∑ni=1(xi−x¯)2=1n−1∑ni=1(xi−x¯)2, yang menyesuaikan fakta bahwa rata-ratasampellebih dekat dengan data daripada rata-rata populasi, untuk membuatnya tidak bias (mengambil nilai yang tepat "pada rata-rata ").
Efeknya secara bertahap hilang dengan meningkatnya ukuran sampel, seperti n−1n pergi ke 1 sebagain→∞.
Tidak ada alasan khusus Anda harus menggunakan estimator yang tidak bias untuk varians, by the way - s2n adalah estimator yang benar-benar valid, dan dalam beberapa kasus bisa dibilang memiliki keunggulan dibandingkan bentuk yang lebih umum (tidak memihak tidak selalu sebesar itu berurusan).
Varians itu sendiri tidak secara langsung mengukur penyebaran. Jika saya menggandakan semua nilai dalam set data saya, saya berpendapat mereka dua kali lipat "menyebar". Tetapi varians meningkat dengan faktor 4. Jadi, biasanya, dikatakan bahwa standar deviasi, daripada varians adalah ukuran penyebaran.
Tentu saja, masalah yang sama terjadi dengan standar deviasi (biasa sn−1 versi) seperti dengan varians - ketika Anda meringkuk poin perubahan standar deviasi, untuk alasan yang sama seperti yang terjadi dengan varians.
Dalam sampel kecil koreksi Bessel membuat standar deviasi agak kurang intuitif sebagai ukuran penyebaran karena efek itu (menduplikasi sampel mengubah nilai). Tetapi banyak ukuran penyebaran mempertahankan nilai yang sama ketika menduplikasi sampel; Saya akan menyebutkan beberapa -
sn (tentu saja)
deviasi mean (absolut) dari mean
penyimpangan median (absolut) dari median
kisaran interkuartil (setidaknya untuk beberapa definisi kuartil sampel)
{3, 5}
itu sendiri adalah 1, per rumus pertama. Seperti yang Anda tunjukkan, si penanya telah mencoba memperkirakan varians dari populasi yang darinya dianggap sebagai sampel, tetapi siapa yang tahu apakah itu benar atau tidak.