@ NRH menjawab pertanyaan ini memberikan bukti yang bagus dan sederhana tentang bias dari standar deviasi sampel. Di sini saya akan secara eksplisit menghitung ekspektasi deviasi standar sampel (pertanyaan kedua poster asli) dari sampel yang terdistribusi normal, pada titik mana biasnya jelas.
Varians sampel yang tidak bias dari serangkaian poin adalahx1,...,xn
s2=1n−1∑i=1n(xi−x¯¯¯)2
Jika didistribusikan secara normal, itu adalah fakta bahwaxi
(n−1)s2σ2∼χ2n−1
di mana adalah varian sebenarnya. The distribusi memiliki kepadatan probabilitasσ2χ2k
p(x)=(1/2)k/2Γ(k/2)xk/2−1e−x/2
menggunakan ini kita dapat memperoleh nilai yang diharapkan dari ;s
E(s)=σ2n−1−−−−−√E(s2(n−1)σ2−−−−−−−−√)=σ2n−1−−−−−√∫∞0x−−√(1/2)(n−1)/2Γ((n−1)/2)x((n−1)/2)−1e−x/2 dx
yang mengikuti dari definisi nilai yang diharapkan dan fakta bahwa adalah akar kuadrat dari variabel terdistribusi . Kuncinya sekarang adalah mengatur ulang istilah sehingga integrand menjadi kepadatan :s2(n−1)σ2−−−−−−√χ2χ2
E(s)=σ2n−1−−−−−√∫∞0(1/2)(n−1)/2Γ(n−12)x(n/2)−1e−x/2 dx=σ2n−1−−−−−√⋅Γ(n/2)Γ(n−12)∫∞0(1/2)(n−1)/2Γ(n/2)x(n/2)−1e−x/2 dx=σ2n−1−−−−−√⋅Γ(n/2)Γ(n−12)⋅(1/2)(n−1)/2(1/2)n/2∫∞0(1/2)n/2Γ(n/2)x(n/2)−1e−x/2 dxχ2n density
sekarang kita tahu integrand baris terakhir sama dengan 1, karena itu adalah kepadatan . Konstanta penyederhanaan sedikit memberi χ2n
E(s)=σ⋅2n−1−−−−−√⋅Γ(n/2)Γ(n−12)
Oleh karena itu bias adalahs
σ−E(s)=σ(1−2n−1−−−−−√⋅Γ(n/2)Γ(n−12))∼σ4n
as .
n→∞
Tidak sulit untuk melihat bahwa bias ini bukan 0 untuk setiap terbatas , sehingga membuktikan standar deviasi sampel bias. Di bawah biasnya adalah plot sebagai fungsi dari untuk berwarna merah bersama dengan berwarna biru:nnσ=11/4n