Saya mencoba mempelajari statistik karena saya menemukan itu sangat lazim sehingga melarang saya belajar beberapa hal jika saya tidak memahaminya dengan benar. Saya mengalami kesulitan memahami gagasan tentang distribusi sampling dari rata-rata sampel. Saya tidak dapat memahami cara beberapa buku dan situs menjelaskannya. Saya pikir saya memiliki pemahaman tetapi tidak yakin apakah itu benar. Di bawah ini adalah upaya saya untuk memahaminya.
Ketika kita berbicara tentang beberapa fenomena yang berdistribusi normal, umumnya (tidak selalu) menyangkut populasi.
Kami ingin menggunakan statistik inferensial untuk memprediksi beberapa hal tentang beberapa populasi, tetapi tidak memiliki semua data. Kami menggunakan pengambilan sampel acak dan setiap sampel dengan ukuran n sama kemungkinannya untuk dipilih.
Jadi kami mengambil banyak sampel, katakanlah 100 dan kemudian distribusi rata-rata sampel tersebut akan mendekati normal sesuai dengan teorema batas pusat. Rata-rata dari sampel berarti akan mendekati rata-rata populasi.
Sekarang yang saya tidak mengerti adalah banyak kali Anda melihat "Sampel 100 orang ..." Bukankah kita membutuhkan sampel 10 atau 100 sampel yang terdiri dari 100 orang untuk memperkirakan populasi rata-rata? Atau apakah ini kasus bahwa kita dapat mengambil sampel tunggal yang cukup besar, katakanlah 1000 dan kemudian katakan bahwa rata-rata akan mendekati rata-rata populasi? ATAU apakah kita mengambil sampel 1000 orang dan kemudian mengambil 100 sampel acak 100 orang di setiap sampel dari 1.000 orang asli yang kami ambil dan kemudian menggunakannya sebagai perkiraan kami?
Apakah mengambil sampel yang cukup besar untuk mendekati rata-rata (hampir) selalu berhasil? Apakah populasi bahkan perlu normal agar ini berfungsi?