Saya selalu diajari bahwa CLT bekerja ketika Anda mengulangi pengambilan sampel, dengan masing-masing sampel cukup besar. Sebagai contoh, bayangkan saya memiliki negara dengan 1.000.000 penduduk. Pemahaman saya tentang CLT adalah bahwa bahkan jika distribusi ketinggian mereka tidak normal, jika saya mengambil 1000 sampel dari 50 orang (yaitu melakukan 1.000 survei dari 50 warga masing-masing), kemudian menghitung tinggi rata-rata mereka untuk setiap sampel, distribusi sampel ini berarti akan menjadi normal.
Namun, saya belum pernah melihat kasus dunia nyata di mana para peneliti mengambil sampel berulang. Sebagai gantinya, mereka mengambil satu sampel besar (yaitu mensurvei 50.000 warga tentang tinggi badan mereka) dan bekerja dari situ.
Mengapa buku statistik mengajarkan pengambilan sampel berulang dan di dunia nyata peneliti hanya melakukan sampel tunggal?
Sunting: Kasus dunia nyata yang saya pikirkan adalah melakukan statistik pada set data 50.000 pengguna twitter. Dataset itu jelas bukan sampel yang diulang, itu hanya satu sampel besar 50.000.