Bagaimana kita bisa mendapatkan distribusi normal sebagai


12

Katakanlah kita memiliki variabel acak dengan rentang nilai yang dibatasi oleh dan b , di mana a adalah nilai minimum dan b nilai maksimum.abab

Saya diberitahu bahwa sebagai , di mana n adalah ukuran sampel kami, distribusi sampling berarti sampel kami adalah distribusi normal. Artinya, seperti yang kita meningkatkan n kita lebih dekat dan lebih dekat dengan distribusi normal, tetapi batas yang sebenarnya sebagai n adalah sama untuk distribusi normal.nnnn

Namun, bukankah bagian dari definisi distribusi normal yang harus diperluas dari ke ?

Jika maks kisaran kami adalah , maka rata-rata sampel maksimum (terlepas dari ukuran sampel) akan sama dengan b , dan rata-rata sampel minimum sama dengan a .bba

Jadi sepertinya bagi saya bahwa bahkan jika kita mengambil batas ketika mendekati tak terhingga, distribusi kita bukanlah distribusi normal yang sebenarnya, karena dibatasi oleh a dan b .nab

Apa yang saya lewatkan ?

Jawaban:


15

Inilah yang Anda lewatkan. Distribusi asimptotik bukan dari (mean sampel), tetapi dari X¯n, di manaθadalah mean dariX.n(X¯nθ)θX

Misalkan menjadi iid variabel acak sedemikian sehingga a < X i < b dan X i memiliki mean θ dan varians σ 2 . Dengan demikian X i telah terikat dukungan. CLT mengatakan bahwa X1,X2,a<Xi<bXiθσ2Xi

n(X¯nθ)dN(0,σ2),

di mana adalah mean sampel. SekarangX¯n

a<Xi<ba<X¯n<baθ<X¯nθ<bθn(aθ)<n(X¯nθ)<n(bθ).

Seperti , batas bawah dan batas atas cenderung masing-masing - dan , dan dengan demikian sebagai n dukungan nnadalah persis seluruh garis nyata.n(X¯nθ)

Setiap kali kita menggunakan CLT dalam praktiknya, kita katakan , dan ini akan selalu menjadi perkiraan.X¯nN(θ,σ2/n)


EDIT: Saya pikir bagian dari kebingungan adalah dari salah tafsir dari Central Limit Theorem. Anda benar bahwa distribusi sampling dari mean sampel adalah

X¯nN(θ,σ2/n).

Namun, distribusi sampling adalah properti sampel hingga. Seperti yang Anda katakan, kami ingin membiarkan ; setelah kami melakukannya tanda akan menjadi hasil yang tepat. Namun, jika kita membiarkan n , kita tidak dapat lagi memiliki n di sisi kanan (karena n sekarang ). Jadi pernyataan berikut ini salah ˉ X n d N ( θ , σ 2 / n )  sebagai  n .nnnn

X¯ndN(θ,σ2/n) as n.

dn

n(X¯nθ)dN(0,σ2)

Untuk melihat bagaimana aljabar bekerja, lihat jawabannya di sini .


X¯nn(X¯nθ)nX¯nnn(X¯nθ)X¯n

Z

@ jeremyradcliff Saya telah mengedit jawaban saya, dan menyertakan tautan yang menjelaskan beberapa detail. Semoga ini lebih masuk akal sekarang.
Greenparker

1
n

7

Jika Anda merujuk pada teorema batas pusat, perhatikan bahwa salah satu cara yang tepat untuk menuliskannya adalah

(x¯μσ)ndN(0,1)

μ,σxi

n

nnn

XiBern(p=0.5)

X¯˙N(p,p(1p)n)

n

P(N(p,p(1p)n)<0)>0

n

P(N(p,p(1p)n)<0)0

Sehingga ketidaksesuaian antara distribusi aktual dan distribusi perkiraan yang menghilang, seperti yang seharusnya terjadi dengan perkiraan.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.