Interval Keyakinan untuk varian diberikan satu pengamatan


25

Ini adalah masalah dari "7th Kolmogorov Student Olympiad in Probability Theory":

Diberikan satu pengamatan dari distribusi dengan kedua parameter tidak diketahui, berikan interval kepercayaan untuk dengan tingkat kepercayaan setidaknya 99%.XNormal(μ,σ2)σ2

Bagi saya sepertinya ini tidak mungkin. Saya punya solusinya, tetapi belum membacanya. Adakah pikiran?

Saya akan memposting solusinya dalam beberapa hari.

[Suntingan lanjutan: Solusi resmi diposting di bawah ini. Solusi Cardinal lebih panjang, tetapi memberikan interval kepercayaan yang lebih baik. Terima kasih juga kepada Max dan Glen_b untuk masukan mereka.]


1
Sepertinya tidak mungkin bagi saya juga; Saya menunggu jawabannya
Peter Flom - Reinstate Monica


3
Ini kertas dengan format yang lebih baik: kertas .
Diasumsikan normal

Heh. Saya ingat pernah membaca makalah tentang hal ini (satu interval pengamatan) beberapa tahun yang lalu. Mungkin yang ini .
Glen_b -Reinstate Monica

1
@ Max, terima kasih untuk tautannya! Saya belum sempat mencermati hal itu, tetapi saya akan melakukannya. Saya memposting jawaban "resmi" di bawah.
Jonathan Christensen

Jawaban:


17

Dilihat melalui lensa ketidaksetaraan probabilitas dan koneksi ke kasus multi-observasi, hasil ini mungkin tidak tampak begitu mustahil, atau, setidaknya, itu mungkin tampak lebih masuk akal.

Biarkan dengan dan tidak dikenal. Kita dapat menulis untuk .XN(μ,σ2)μσ2X=σZ+μZN(0,1)

Klaim Utama : adalah interval kepercayaan untuk mana adalah kuantil -level dari distribusi chi-squared dengan satu derajat kebebasan. Selain itu, karena interval ini memiliki persis cakupan ketika , itu adalah interval sempit kemungkinan bentuk untuk beberapa .[0,X2/qα)(1α)σ2qαα (1α)μ=0[0,bX2)bR

Alasan untuk optimis

Ingat bahwa dalam kasus , dengan , interval kepercayaan tipikal untuk adalah mana adalah kuantil-tingkat dari chi-kuadrat dengan derajat kebebasan. Ini, tentu saja, berlaku untuk semua . Meskipun ini adalah interval yang paling populer (disebut interval sama-ekor untuk alasan yang jelas), ini bukan satu-satunya atau bahkan yang memiliki lebar terkecil! Seperti yang seharusnya, pemilihan lain yang valid adalah n2T=i=1n(XiX¯)2 (1α)σ2

(Tqn1,(1α)/2,Tqn1,α/2),
qk,aakμ
(0,Tqn1,α).

Karena, , lalu juga memiliki cakupan setidaknya .Ti=1nXi2

(0,i=1nXi2qn1,α),
(1α)

Dilihat dari sudut pandang ini, kita mungkin optimis bahwa interval dalam klaim utama adalah benar untuk . Perbedaan utama adalah bahwa tidak ada distribusi nol-derajat-kebebasan-kuadrat untuk kasus pengamatan tunggal, jadi kita harus berharap bahwa menggunakan kuantil satu derajat kebebasan akan bekerja.n=1

Setengah langkah menuju tujuan kami ( Memanfaatkan ekor kanan )

Sebelum menyelami bukti klaim utama, pertama mari kita lihat klaim awal yang hampir tidak sekuat atau memuaskan secara statistik, tetapi mungkin memberikan beberapa wawasan tambahan tentang apa yang sedang terjadi. Anda dapat melewatkan bukti klaim utama di bawah ini, tanpa banyak kerugian (jika ada). Pada bagian ini dan selanjutnya, bukti — meski sedikit halus — didasarkan hanya pada fakta-fakta dasar: monotonitas probabilitas, dan simetri serta unimodality dari distribusi normal.

Klaim bantu : adalah interval kepercayaan untuk selama . Di sini adalah quantile tingkat- dari standar normal.[0,X2/zα2)(1α)σ2α>1/2zαα

Bukti . danoleh simetri, jadi dalam apa yang berikut kita dapat mengambil tanpa kehilangan keumuman Sekarang, untuk dan , dan demikian pula dengan , kita melihat bahwa Ini hanya berfungsi untuk , karena itulah yang diperlukan untuk .|X|=|X||σZ+μ|=d|σZ+μ|μ0θ0μ0

P(|X|>θ)P(X>θ)=P(σZ+μ>θ)P(Z>θ/σ),
θ=zασ
P(0σ2<X2/zα2)1α.
α>1/2zα>0

Ini membuktikan klaim pembantu. Meskipun ilustratif, itu tidak meyakinkan dari perspektif statistik karena itu membutuhkan sangat besar untuk bekerja.α

Membuktikan klaim utama

Penyempurnaan argumen di atas mengarah pada hasil yang akan bekerja untuk tingkat kepercayaan yang sewenang-wenang. Pertama, perhatikan bahwa Set dan . Kemudian, Jika kita dapat menunjukkan bahwa tangan kanan sisi kenaikan untuk setiap tetap , maka kita dapat menggunakan argumen yang sama seperti dalam argumen sebelumnya. Ini setidaknya masuk akal, karena kami ingin percaya bahwa jika mean meningkat, maka menjadi lebih mungkin bahwa kita melihat nilai dengan modulus yang melebihi

P(|X|>θ)=P(|Z+μ/σ|>θ/σ).
a=μ/σ0b=θ/σ0
P(|Z+a|>b)=Φ(ab)+Φ(ab).
abb. (Namun, kita harus waspada terhadap seberapa cepat massa berkurang di ekor kiri!)

Set . Kemudian Perhatikan bahwa dan untuk positif , menurun di . Sekarang, untuk , mudah untuk melihat bahwa . Fakta-fakta ini diambil bersama-sama dengan mudah menyiratkan bahwa untuk semua dan semua yang diperbaiki .fb(a)=Φ(ab)+Φ(ab)

fb(a)=φ(ab)φ(ab)=φ(ab)φ(a+b).
fb(0)=0uφ(u)ua(0,2b)φ(ab)φ(b)=φ(b)
fb(a)0
a0b0

Karenanya, kami telah memperlihatkan bahwa untuk dan , a0b0

P(|Z+a|>b)P(|Z|>b)=2Φ(b).

Mengurai semua ini, jika kita mengambil , kita mendapatkan yang menetapkan klaim utama.θ=qασ

P(X2>qασ2)P(Z2>qα)=1α,

Komentar penutup : Pembacaan yang cermat atas argumen di atas menunjukkan bahwa ia hanya menggunakan properti simetris dan unimodal dari distribusi normal. Oleh karena itu, pendekatan ini bekerja secara analog untuk mendapatkan interval kepercayaan dari pengamatan tunggal dari keluarga skala lokasi simetris unimodal, misalnya, distribusi Cauchy atau Laplace.


Wow! dan siswa diharapkan untuk mengajukan argumen semacam ini dalam waktu singkat ujian Olimpiade?
Dilip Sarwate

1
@Dilip: Saya tidak tahu! Saya tidak terbiasa dengan format Olimpiade ini atau apa yang diharapkan dari solusi. Dari pembacaan literal, saya pikir jawaban Scortchi dapat diterima. Saya lebih tertarik untuk mencoba mencari tahu seberapa jauh seseorang bisa mendapatkan dengan solusi "non-sepele". Eksplorasi saya sendiri (sangat minim) mengikuti alur pemikiran yang sama dengan yang dijelaskan dalam jawaban (dengan satu jalan memutar). Sangat mungkin ada solusi yang lebih baik. :-)
kardinal

Ini jauh lebih lama daripada solusi "resmi", tetapi ini memberikan batasan yang lebih baik pada varians, jadi saya menandainya sebagai jawaban "benar". Saya telah memposting jawaban "resmi" di bawah ini, serta beberapa hasil simulasi dan diskusi. Terima kasih, @ kardinal!
Jonathan Christensen

2
@ Jonathan: Terima kasih. Ya, saya bisa membuat buktinya sedikit lebih singkat. Karena latar belakang yang luas dari para peserta di sini, saya sering cenderung memanjakan diri dalam detail ekstra (atau, mungkin, berlebihan). :-)
kardinal

12

Waktunya untuk menindaklanjuti! Inilah solusi yang saya berikan:

Kami akan membangun interval kepercayaan dari formulir , di mana adalah beberapa statistik. Menurut definisi ini akan menjadi interval kepercayaan dengan tingkat kepercayaan setidaknya 99% jika Kami perhatikan bahwa kepadatan distribusi tidak melebihi . Karena itu, untuk setiap . Maka Memasukkan[0,T(X))T()

(μR)(σ>0)Pμ,σ2(σ2>T(X))<0.01.
N(μ,σ2)1/σ2πP(|X|a)a/σa0
tP(|X|/σt)=P(X2t2σ2)=P(σ2X2/t2).
t=0.01kami mendapatkan bahwa statistik yang sesuai adalahT(X)=10000X2.

Interval kepercayaan (yang sangat lebar) sedikit konservatif dalam simulasi, tanpa cakupan empiris (dalam 100.000 simulasi) lebih rendah dari 99,15% karena saya memvariasikan CV pada banyak pesanan besar.

Sebagai perbandingan, saya juga mensimulasikan interval kepercayaan kardinal. Saya harus mencatat bahwa interval kardinal agak sedikit lebih sempit - dalam kasus 99%, akhirnya menjadi sekitar , dibandingkan dengan dalam solusi yang disediakan. Cakupan empiris tepat di tingkat nominal, sekali lagi atas banyak pesanan besarnya untuk CV. Jadi intervalnya pasti menang.6300X210000X2

Saya belum punya waktu untuk melihat dengan cermat pada kertas yang diposting Max, tapi saya berencana untuk melihatnya dan mungkin menambahkan beberapa komentar mengenai hal itu nanti (yaitu, tidak lebih dari seminggu). Makalah itu mengklaim interval kepercayaan 99% , yang memiliki cakupan empiris sedikit lebih rendah (sekitar 98,85%) daripada cakupan nominal untuk CV besar dalam simulasi singkat saya.(0,4900X2)


1
(+1) Itu solusi yang bagus. Haruskah Anda memiliki alih-alih dalam persamaan tampilan? tt
kardinal

2
Beberapa poin lagi: Solusi Anda dapat dibuat menjadi sangat dekat dengan saya tanpa ada perubahan dalam argumen. Perhatikan bahwa Anda dapat mengklaim bahwa . Kemudian intervalnya menjadi untuk setiap . Menggunakan menghasilkan versus dalam jawaban saya. Semakin tinggi tingkat kepercayaan (mis., Semakin kecil ), semakin dekat metode Anda dibandingkan dengan saya (meskipun interval Anda akan selalu lebih lebar). P(|X|a)2a/σ2π(0,2X2/πα2)αα=0.01T(X)6366.198X21/q0.016365.864α
kardinal

1
Kedua, saya belum melihat makalah itu, tetapi saya memiliki keraguan kuat bahwa dapat menjadi interval kepercayaan 99% yang valid. Memang, pertimbangkan semua interval kepercayaan dari formulir untuk beberapa . Kemudian, ketika , kita memiliki persis chi-squared dengan satu derajat kebebasan dan terkecil yang bisa kita pilih dalam contoh ini adalah . Dengan kata lain, interval yang diberikan dalam jawaban saya adalah yang sesempit mungkin dari bentuk yang dinyatakan. (0,4900X2)(0,bX2)bμ=0X2/σ2bb=1/qα
kardinal

1
Saya membuat (diduga) koreksi kesalahan ketik. Juga, pchisq(1/4900,1,lower.tail=F)di Rkembali 0.9886, cukup dekat dengan hasil simulasi untuk interval. (0,4900X2)
kardinal

1
Terima kasih atas semua komentarnya, @cardinal. Saya pikir perubahan Anda sudah benar, meskipun saya mengetiknya seperti di solusi aslinya - salah ketik, saya kira.
Jonathan Christensen

5

CI mungkin.(0,)


1
Saya pikir akan sangat membantu bagi Anda untuk mengatakan mengapa Anda tidak bisa mendapatkan interval kepercayaan yang terbatas.
Diasumsikan normal

1
@ Max Saya tidak cukup pintar - tetapi pertanyaannya tidak menanyakan satu.
Scortchi

4
+1 untuk ini. Pertanyaan tidak mengatakan CI dengan cakupan minimal, dan pada kenyataannya menyiratkan bahwa ini mungkin dapat diterima melalui kata-kata yang aneh, "interval kepercayaan dengan tingkat kepercayaan setidaknya 99%."
Ari B. Friedman
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.