Jika Anda bermaksud mengambil nilai dari populasi yang terdistribusi normal, nilai itu memiliki fungsi kepadatan probabilitas yang sama dengan populasi. Jadi undian sajaxi dari suatu populasi X∼N(μ,σ2) akan diambil dari distribusi populasi yang sama N(μ,σ2)
Jadi itu berarti sampel kecil masih didistribusikan Normal, kan? Ya, tentu saja, bahwa jika setiap undian berasal dari distribusi Normal, itu sendiri akan memiliki distribusi Normal (sebelum kita benar-benar mengambil undian, setidaknya).
Sepertinya Anda bertanya tentang x¯, karena kita berbicara tentang sampel, distribusi t, dan sejenisnya. x¯ bukan masih Normal untuk sampel kecil, meskipun karena setiap pengamatan ximemiliki distribusi normal. Mengapa? Karena itu hanya jumlah variabel acak normal lainnya!
Glen_b membuat tangkapan yang bagus di tempat saya bergabung x¯ dan t-statistik. Penting untuk dicatat bahwa sementarax¯ masih Normal untuk ukuran sampel apa pun (jika populasi sampelnya adalah Normal), tstatistik yang dibangun dari sampel Normal bukan Normal untuk ukuran sampel kecil. Mengapa?
Kami punya dua kasus berbeda di sini. Ada kemungkinan bahwa distribusi sudah diketahui, dalam hal ini kita tahu nilai sebenarnya dariσ2. Mungkin juga ituσ2 tidak diketahui, dalam hal ini kita harus memperkirakannya.
1: Kami tahu σ2. Ini berarti kita dapat menggunakan az statistik dihitung langsung dari parameter populasi σ2.
Jika kita yakin tentang nilai sebenarnya dari σ2, maka kita dapat melakukan mis pengujian hipotesis pada x¯ menggunakan distribusi N(μ,σ2n√). Secara khusus, kita dapat membakukannya, mengubahnya menjadi nilaiZ, untuk distribusi yang mana N(0,1) Dan jika kita tahu nilainya σ2, maka kita cukup menggunakan distribusi Normal Normal untuk perhitungan kita. Normal, tidak peduli seberapa besar atau kecil sampel kami!
2: Kami tidak tahu σ2, dan kami memperkirakannya dengan s2.
Jika kita tidak tahu σ2, maka kita perlu mengganti nilai yang dihitung dari penduga dengan nilai populasi sebenarnya. Biasanya, itu akan terjadis2, varians sampel. Tetapi varians sampel memiliki distribusinya sendiri juga! Jadi kita sebenarnya tidak yakin tentang nilainya. Dan jika ukuran sampel kami kecil, maka 'varians dari sampel varians' cukup signifikan untuk mempengaruhi carax¯didistribusikan. Jadi ketika kita melakukan standarisasix¯, itu tidak terdistribusi secara normal lagi, meskipun semuanya xi yang masuk ke penghitungan itu didistribusikan Normal.
Untuk informasi lebih lanjut, baca tentang definisi distribusi-t , dan distribusi varian sampel .