Apa yang ingin Anda temukan adalah standar deviasi dari distribusi sampling mean. Yaitu, dalam bahasa Inggris yang sederhana, distribusi sampling adalah ketika Anda memilih item dari populasi Anda, menambahkannya bersama-sama, dan membagi jumlahnya dengan . Kami kemudian menemukan varians dari kuantitas ini dan mendapatkan simpangan baku dengan mengambil akar kuadrat dari variansnya.nn
Jadi, biarkan item yang Anda pilih diwakili oleh variabel acak , masing-masingnya terdistribusi secara identik dengan varians . Mereka disampel secara independen, jadi varians dari penjumlahan hanyalah penjumlahan dari varians.
Xi,1≤i≤nσ2
Var(∑i=1nXi)=∑i=1nVar(Xi)=∑i=1nσ2=nσ2
Selanjutnya kita bagi dengan . Kita tahu secara umum bahwa , jadi menempatkan kita milikinVar(kY)=k2Var(Y)k=1/n
Var(∑ni=1Xin)=1n2Var(∑i=1nXi)=1n2nσ2=σ2n
Terakhir, ambil akar kuadrat untuk mendapatkan standar deviasi . Ketika deviasi standar populasi tidak tersedia standar deviasi sampel digunakan sebagai perkiraan, memberikan .σn−−√ssn−−√
Semua hal di atas benar terlepas dari distribusi , tetapi menimbulkan pertanyaan tentang apa yang sebenarnya ingin Anda lakukan dengan kesalahan standar? Biasanya Anda mungkin ingin membuat interval kepercayaan, dan penting untuk menentukan probabilitas untuk membuat interval kepercayaan yang mengandung nilai rata-rata.Xi
Jika Anda normal, ini mudah, karena kemudian distribusi sampel juga terdistribusi normal. Anda dapat mengatakan 68% sampel dari mean akan berada dalam 1 kesalahan standar dari mean sebenarnya, 95% akan berada dalam 2 kesalahan standar, dll.Xi
Jika Anda memiliki sampel yang cukup besar (atau sampel yang lebih kecil dan tidak terlalu abnormal) maka Anda dapat menggunakan teorema limit pusat dan mengatakan bahwa distribusi sampling kira - kira terdistribusi secara normal, dan pernyataan probabilitas Anda juga merupakan perkiraan.Xi
Sebuah kasus di titik adalah memperkirakan proporsi , di mana Anda menggambar item masing-masing dari distribusi Bernouilli. dari setiap distribusi adalah dan karenanya kesalahan standar adalah (proporsi diperkirakan menggunakan data). Untuk kemudian langsung mengatakan bahwa sekitar beberapa% sampel berada dalam begitu banyak standar deviasi rata-rata, Anda perlu memahami kapan distribusi sampling mendekati normal. Pengambilan sampel berulang dari distribusi Bernouilli sama dengan pengambilan sampel dari distribusi Binomial, dan satu aturan umum adalah untuk memperkirakan hanya ketika dan adalahpnXip(1−p)p(1−p)/n−−−−−−−−−√pnpn(1−p)≥5. (Lihat wikipedia untuk diskusi yang lebih mendalam tentang perkiraan binomial dengan normal. Lihat di sini untuk contoh kerja kesalahan standar dengan proporsi.)
Jika, di sisi lain, distribusi sampel Anda tidak dapat didekati dengan distribusi normal, maka kesalahan standar jauh lebih berguna. Misalnya, dengan distribusi asimetris yang sangat miring, Anda tidak dapat mengatakan bahwa% sampel yang sama akan menjadi standar deviasi di kedua sisi rata-rata, dan Anda mungkin ingin menemukan cara berbeda untuk mengaitkan probabilitas dengan sampel.±1