Bagaimana cara kerja kesalahan standar?


17

Saya telah melihat ke dalam cara kerja kesalahan standar baru-baru ini, dan saya mendapati diri saya tidak dapat memahami cara kerjanya. Pemahaman saya tentang kesalahan standar adalah bahwa itu adalah standar deviasi dari distribusi mean sampel. Pertanyaan saya adalah:

• bagaimana kita tahu kesalahan standar adalah standar deviasi dari sampel berarti ketika kita biasanya mengambil hanya satu sampel?

• mengapa persamaan untuk menghitung kesalahan standar tidak mencerminkan persamaan standar deviasi untuk sampel tunggal?


Ketika Anda mengatakan "sampel tunggal", maksud Anda satu set sampel atau benar-benar ukuran sampel 1?
Erik

1
Ini dijelaskan untuk masalah yang sederhana namun menarik (respons ternary) dalam bahasa sederhana, non-statistik di stats.stackexchange.com/a/18609 .
Whuber

Jawaban:


13

Ya, kesalahan standar mean (SEM) adalah standar deviasi (SD) dari mean. (Kesalahan standar adalah cara lain untuk mengatakan SD dari distribusi pengambilan sampel. Dalam hal ini, distribusi pengambilan sampel adalah sarana untuk sampel dengan ukuran tetap, katakan N.) Ada hubungan matematis antara SEM dan populasi SD: SEM = populasi SD / akar kuadrat dari N. Hubungan matematis ini sangat membantu, karena kita hampir tidak pernah memiliki estimasi langsung dari SEM tetapi kami memang memiliki estimasi populasi SD (yaitu SD dari sampel kami). Mengenai pertanyaan kedua Anda, jika Anda mengumpulkan beberapa sampel ukuran N dan menghitung rata-rata untuk setiap sampel, Anda dapat memperkirakan SEM hanya dengan menghitung SD cara. Jadi rumus untuk SEM memang mencerminkan rumus untuk SD dari sampel tunggal.


13

Misalkan independen dan terdistribusi secara identik. Ini adalah situasi yang saya yakin Anda maksudkan. Biarkan rata-rata umum mereka menjadi μ dan varians umum mereka adalah σ 2 .X1,X2,,Xnμσ2

Sekarang mean sampel adalah . Linearitas harapan menunjukkan bahwa rata-rata X b juga μ . Asumsi kemandirian menyiratkan varian X b adalah jumlah dari varians dari ketentuan-ketentuannya. Setiap istilah X i / n memiliki varians σ 2 / n 2 (karena varian dari konstanta kali variabel acak adalah konstanta kuadrat dikalikan varians dari variabel acak). Kami memiliki nXb=iXi/nXbμXbXi/nσ2/n2nvariabel terdistribusi secara identik untuk dijumlahkan, sehingga setiap istilah memiliki varian yang sama. Sebagai hasilnya, kita mendapatkan untuk varians dari mean sampel.nσ2/n2=σ2/n

Biasanya kita tidak tahu sehingga kita harus memperkirakannya dari data. Tergantung pada pengaturannya, ada berbagai cara untuk melakukan ini. Dua estimasi tujuan umum yang paling umum dari σ 2 adalah varians sampel s 2 = 1σ2σ2 dan kelipatan kecilnya,s 2 u =ns2=1ni(XiXb)2(yang merupakan penaksir tidak bias dariσ2). Menggunakan salah satu dari ini di tempatσ2pada paragraf sebelumnya dan mengambil akar kuadrat memberikan kesalahan standar dalam bentuks/su2=nn1s2σ2σ2 atausu/s/n .su/n


1
Ini sangat bagus. Apakah Anda memiliki saran untuk buku atau bacaan untuk mengembangkan keterampilan berpikir yang serupa. Terima kasih.
q126t

Jawaban elegan!
Jinhua Wang

7

+1 untuk kedua @ JoelW. & @MichaelChernick. Saya ingin menambahkan detail ke jawaban @ JoelW. Dia mencatat bahwa "kita hampir tidak pernah memiliki perkiraan langsung dari SEM", yang pada dasarnya benar, tetapi ada baiknya secara eksplisit mengakui peringatan untuk pernyataan itu. Khususnya, ketika sebuah studi membandingkan beberapa kelompok / perawatan (misalnya, plasebo vs obat standar vs obat baru), sebuah ANOVA biasanya digunakan untuk melihat apakah semuanya sama. Hipotesis nol adalah bahwa masing-masing kelompok telah diambil dari populasi yang sama, dan dengan demikian, ketiganya berarti estimasi rata-rata populasi. Yaitu, hipotesis nol dalam ANOVA standar mengasumsikan bahwa Anda memang memiliki perkiraan langsung dari SEM. Pertimbangkan persamaan untuk varian dari distribusi sampling mean: di manaσ 2 p o p adalah varians populasi, dannjadalah jumlah kelompok. Meskipun kami biasanya tidak melakukan perhitungan dengan cara ini, kamihanyabisamenggunakan rumus standar untuk memasukkan nilai estimasi, dan dengan perombakan aljabar minimal, bentukstatistikFseperti: F=nj×s 2 ˉ x

σx¯2=σpop2nj,
σpop2njF Dalam hal ini, kita benar-benar akan menggunakan rumus standar (hanya diterapkan di atas rata-rata grup), yaitu: s 2 ˉ x = n j j = 1 ( ˉ x j- ˉ x .)2
F=nj×sx¯2spooled within group2
denganx. menjadi rata-rata dari kelompok berarti.
sx¯2=j=1nj(x¯jx¯.)2nj1,
x.

Dalam hal itu kami biasanya percaya bahwa hipotesis nol itu tidak benar, poin @ JoelW benar, tetapi saya bekerja melalui titik ini, karena saya pikir kejelasan yang diberikannya sangat membantu untuk memahami masalah ini.


2
Saya pikir komentar Anda pada dasarnya sama dengan yang ini, yang ditulis dengan notasi matematika yang lebih sedikit: stats.stackexchange.com/questions/32206/…
Joel W.
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.