Apa yang merupakan penduga standar deviasi dari standar deviasi jika normalitas data dapat diasumsikan?
Apa yang merupakan penduga standar deviasi dari standar deviasi jika normalitas data dapat diasumsikan?
Jawaban:
Biarkan . Seperti yang ditunjukkan pada utas ini , simpangan baku dari simpangan baku sampel,
aku s
di mana adalah fungsi gamma , n adalah ukuran sampel dan \ overline {X} = \ frac {1} {n} \ sum_ {i = 1} ^ {n} X_i adalah mean sampel. Karena s adalah penaksir konsisten \ sigma , ini menyarankan mengganti \ sigma dengan s dalam persamaan di atas untuk mendapatkan penaksir yang konsisten dari {\ rm SD} (s) .¯ X = 1sσσsSD(s)
Jika Anda merupakan penaksir yang tidak bias yang Anda cari, kami melihat di utas ini bahwa , yang, secara linearitas harapan, menyarankan
sebagai penaksir yang tidak bias dari . Semua ini bersama dengan linearitas ekspektasi memberikan penaksir yang tidak bias dari : S D ( s )
Asumsikan Anda mengamati iid dari normal dengan mean nol dan varians . Standar deviasi (empiris) adalah akar kuadrat dari estimator dari (tidak bias atau tidak yang bukan pertanyaannya). Sebagai estimator (diperoleh dengan ), memiliki varian yang dapat dihitung secara teoritis. Mungkin yang Anda sebut deviasi standar dari deviasi standar sebenarnya adalah akar kuadrat dari varian deviasi standar, yaitu ? Ini bukan penaksir, ini adalah kuantitas teoretis (sepertiσ 2 σ 2 σ 2 X 1 , ... , X n σ √ σ/ √ harus dikonfirmasi) yang dapat dihitung secara eksplisit!
@ Macro memberikan penjelasan matematis yang bagus dengan persamaan untuk menghitung. Berikut ini adalah eksplorasi yang lebih umum untuk orang-orang yang kurang matematis.
Saya pikir istilah "SD of SD" membingungkan banyak orang. Lebih mudah untuk berpikir tentang interval kepercayaan dari SD. Seberapa tepat simpangan baku yang Anda hitung dari sampel? Hanya kebetulan Anda mungkin telah mendapatkan data yang dikumpulkan bersama, membuat sampel SD jauh lebih rendah daripada populasi SD. Atau Anda mungkin memiliki nilai yang diperoleh secara acak yang jauh lebih tersebar daripada populasi keseluruhan, menjadikan sampel SD lebih tinggi daripada populasi SD.
Menafsirkan CI SD sangat mudah. Mulailah dengan asumsi adat bahwa data Anda diambil secara acak dan independen dari distribusi Gaussian. Sekarang ulangi pengambilan sampel ini berkali-kali. Anda mengharapkan 95% interval kepercayaan tersebut untuk memasukkan populasi benar SD.
Berapa lebar interval kepercayaan 95% SD? Itu tergantung pada ukuran sampel (n) tentu saja.
n: 95% CI SD
2: 0,45 * SD hingga 31,9 * SD
3: 0,52 * SD hingga 6,29 * SD
5: 0,60 * SD hingga 2,87 * SD
10: 0,69 * SD hingga 1,83 * SD
25: 0.78 * SD hingga 1.39 * SD
50: 0.84 * SD hingga 1.25 * SD
100: 0.88 * SD hingga 1.16 * SD
500: 0.94 * SD hingga 1.07 * SD