n ( N - 1 ) / N = 1 - ( 1 / N ) 1 - 2 / N 1 - 17 / N exp ( - 1 / N )N adalah ukuran populasi dan adalah ukuran sampel. Pertanyaannya menanyakan mengapa varians populasi adalah deviasi kuadrat rata-rata dari mean daripada kali. Untuk itu, mengapa berhenti di situ? Mengapa tidak mengalikan deviasi kuadrat rata-rata dengan , atau , atau , misalnya?n(N−1)/N=1−(1/N)1−2/N1−17/Nexp(−1/N)
Sebenarnya ada alasan bagus untuk tidak melakukannya. Salah satu dari angka-angka ini yang baru saja saya sebutkan akan berfungsi dengan baik sebagai cara untuk menghitung "penyebaran tipikal" dalam populasi. Namun, tanpa pengetahuan sebelumnya tentang ukuran populasi, mustahil untuk menggunakan sampel acak untuk menemukan penduga yang tidak bias dari angka tersebut. Kita tahu bahwa varians sampel , yang mengalikan deviasi kuadrat rata-rata dari mean sampel dengan , adalah penaksir yang tidak bias dari varians populasi yang biasa ketika pengambilan sampel dengan penggantian. (Tidak ada masalah dengan membuat koreksi ini, karena kita tahu !) Oleh karena itu varians sampel akan menjadi penaksir yang bias dari kelipatan dari setiap varians populasi di mana kelipatan tersebut, sepertin 1 - 1 / N(n−1)/nn1−1/N, tidak diketahui secara pasti sebelumnya.
Masalah sejumlah bias yang tidak diketahui ini akan menyebar ke semua uji statistik yang menggunakan varians sampel, termasuk uji-t dan uji-F. Akibatnya, membaginya dengan apa pun selain dalam rumus varians populasi akan mengharuskan kita untuk mengubah semua tabulasi statistik t-statistik dan F-statistik (dan banyak tabel lainnya juga), tetapi penyesuaiannya akan tergantung pada ukuran populasi. Tidak ada yang mau harus membuat tabel untuk setiap kemungkinan ! Apalagi saat itu tidak perlu.NNN
Sebagai masalah praktis, ketika cukup kecil bahwa menggunakan bukan dalam formula membuat perbedaan, Anda biasanya lakukan tahu ukuran populasi (atau bisa menebak secara akurat) dan Anda mungkin akan resor untuk jauh lebih substansial kecil-populasi koreksi ketika bekerja dengan sampel acak (tanpa penggantian) dari populasi. Dalam semua kasus lain, siapa yang peduli? Perbedaannya tidak masalah. Untuk alasan ini, dipandu oleh pertimbangan pedagogis (yaitu, fokus pada detail yang penting dan mengabaikan detail yang tidak), beberapa teks statistik pengantar yang sangat baik bahkan tidak repot-repot untuk mengajarkan perbedaan: mereka hanya menyediakan formula varian tunggal ( dibagi denganN - 1 N N nNN−1NN atau seperti kasusnya).n