Untuk masalah apa atau game mana varian dan solusi optimal deviasi standar untuk?

Untuk variabel acak tertentu (atau populasi, atau proses stokastik), ekspektasi matematis adalah jawaban atas pertanyaan. Perkiraan titik apa yang meminimalkan kerugian kuadrat yang diharapkan? . Selain itu, ini adalah solusi optimal untuk game. Tebak realisasi berikutnya dari variabel acak (atau undian baru dari populasi), dan saya akan menghukum Anda dengan jarak kuadrat antara nilai dan tebakan Anda jika Anda memiliki disutilitas linear dalam hal hukuman. Median adalah jawaban untuk pertanyaan terkait di bawah kerugian absolut dan mode adalah jawaban di bawah kehilangan "semua atau tidak sama sekali".

Pertanyaan: Apakah varian dan standar deviasi menjawab pertanyaan serupa? Apakah mereka?

Motivasi untuk pertanyaan ini berasal dari pengajaran langkah-langkah dasar kecenderungan dan penyebaran pusat. Sementara ukuran-ukuran kecenderungan sentral dapat dimotivasi oleh masalah-masalah teoretis keputusan di atas, saya bertanya-tanya bagaimana seseorang dapat memotivasi ukuran-ukuran penyebaran.

— Richard Hardy
sumber

Pertanyaan yang sangat menarik. Pendekatan awal saya adalah bahwa "permainan" secara kualitatif sama dengan apa yang sudah Anda jelaskan, kecuali bahwa pertanyaannya mengharapkan (tidak ada permainan kata pun) jawabannya adalah tentang kisaran nilai alih-alih satu poin, karena menyebar tanpa titik referensi agak tidak lengkap (jika tidak berarti) informasi.

— Emil

Perhatikan bahwa varians itu sendiri merupakan harapan - jika maka .

Y = (X - μ)^{2}

$Y=(X-\mu)^2$

Var (X) = E (Y)

$\text{Var}(X)=E(Y)$

— Glen_b -Reinstate Monica

@ Glen_b, Anda benar, dan saya mengerti (saya seharusnya memasukkannya dalam teks pertanyaan). "Tebak perbedaan antara nilai berikutnya dan harapan dan saya akan menghukum Anda secara kuadratik" akan menjadi permainan. Apakah itu yang terbaik? Tidak terdengar permainan yang sangat praktis atau sangat menyenangkan, IMHO.

— Richard Hardy

Jika saya telah memahami pertanyaan sebagaimana dimaksud, Anda harus mempertimbangkan pengaturan di mana Anda dapat memperoleh realisasi independen dari setiap variabel acak dengan sembarang distribusi (memiliki varian hingga ). "Game" ditentukan oleh fungsi dan untuk dijelaskan. Ini terdiri dari langkah-langkah dan aturan berikut: $X$ $F$ $\sigma^2(F)$ $h$ $\mathcal L$

Lawan Anda ("Alam") mengungkapkan $F.$
Sebagai tanggapan, Anda menghasilkan angka "prediksi" Anda. $t(F),$

Untuk mengevaluasi hasil permainan, perhitungan berikut dilakukan:

Sebuah sampel dari pengamatan iid diambil dari $n$ $\mathbf{X}=X_1, X_2, \ldots, X_n$ $F.$
Fungsi telah ditentukan diterapkan pada sampel, menghasilkan angka "statistik." $h$ $h(\mathbf{X}),$
"Fungsi kerugian" membandingkan "prediksi" dengan statistik menghasilkan angka non-negatif $\mathcal{L}$ $t(F)$ $h(\mathbf{X}),$ $\mathcal{L}(t(F), h(\mathbf{X})).$
Hasil dari permainan adalah kerugian yang diharapkan (atau "risiko")
$R_{(L, h)} (t, F) = E (L (t (F), h (X))) .$ $R_{(\mathcal{L}, h)}(t, F) = E(\mathcal{L}(t(F), h(\mathbf{X}))).$

Tujuan Anda adalah merespons gerakan Nature dengan menentukan beberapa yang meminimalkan risiko. $t$

Misalnya, dalam permainan dengan fungsi dan hilangnya bentuk untuk beberapa angka positif langkah optimal Anda adalah untuk memilih sebagai harapan $h(X_1)=X_1$ $\mathcal{L}(t, h) = \lambda(t-h)^2$ $\lambda,$ $t(F)$ $F.$

Pertanyaan di depan kita adalah,

Apakah ada dan yang langkah optimalnya adalah memilih sebagai varian ? $\mathcal{L}$ $h$ $t(F)$ $\sigma^2(F)$

Ini siap dijawab dengan menunjukkan varians sebagai harapan. Salah satu caranya adalah dengan menetapkan bahwa dan terus menggunakan kerugian kuadratik Setelah mengamati itu

h (X_{1}, X_{2}) = \frac{1}{2} (X_{1} - X_{2})^{2}

$h(X_1,X_2) = \frac{1}{2}(X_1-X_2)^2$

L (t, h) = (t - h)^{2} .

$\mathcal{L}(t,h) = (t-h)^2.$

E (h (X)) = σ^{2} (F),

$E(h(\mathbf{X})) = \sigma^2(F),$

Misalnya memungkinkan kita untuk menyimpulkan bahwa ini dan ini menjawab pertanyaan tentang varians. $h$ $\mathcal L$

Bagaimana dengan standar deviasi ? Sekali lagi, kita hanya perlu menunjukkan ini sebagai harapan dari statistik sampel. Namun, itu tidak mungkin, karena bahkan ketika kita membatasi untuk keluarga distribusi Bernoulli kita hanya dapat memperoleh estimator yang tidak bias dari fungsi polinom tetapi bukan fungsi polinomial pada domain (Lihat Untuk distribusi binomial, mengapa tidak ada penaksir yang tidak bias untuk ? Untuk argumen umum tentang distribusi Binomial, di mana pertanyaan ini dapat dikurangi setelah rata-rata $\sigma(F)$ $F$ $(p)$ $p,$ $\sigma(F) = \sqrt{p(1-p)}$ $p\in (0,1).$ $1/p$ $h$ atas semua permutasi) $X_i.$

— whuber
sumber

Terima kasih atas artikulasi yang jelas dari pertanyaan saya dan jawaban yang sama jelasnya. Apakah Anda juga memiliki contoh yang tergantung pada semua sampel poin, bukan hanya dua?

h

$h$

n

$n$

— Richard Hardy

Ada cara standar untuk beralih dari ke : hitung statistik untuk semua pasangan dan rata-rata. Memang, itu menghasilkan karakterisasi kovarians saya di stats.stackexchange.com/a/18200/919 . Untuk teori formal ini, membaca tentang statistik U .

2

$2$

n

$n$

— whuber

Terima kasih banyak!

— Richard Hardy