Apa hasil paling kuat tentang maksimum Gaussi Idul Fitri? Yang paling banyak digunakan dalam praktik?


9

Diberikan X1,,Xn,N(0,1) iid, pertimbangkan variabel acak

Zn:=max1inXi.

Pertanyaan: Apa hasil paling penting dari variabel acak ini?

Untuk mengklarifikasi "kepentingan", hasil mana yang memiliki hasil paling banyak seperti konsekuensi logis? Manakah dari hasil yang paling sering digunakan dalam praktek?

Lebih khusus lagi, tampaknya menjadi pengetahuan cerita rakyat di antara para ahli statistik (teoretis) bahwa Zn "pada dasarnya sama dengan" 2logn , setidaknya asimptotik. (Lihat pertanyaan terkait ini .)

Namun, ada banyak hasil terkait dari jenis ini, dan tampaknya menjadi kasus yang sebagian besar tidak setara, juga tidak menyiratkan satu sama lain. Misalnya ,

(1)Zn2logna.s.1,

yang jika tidak ada yang lain juga menyiratkan hasil yang sesuai dalam probabilitas dan distribusi.

Namun, itu bahkan tidak menyiratkan hasil yang tampaknya juga terkait (lihat pertanyaan lain ini ), seperti

(2)limnEZn2logn=1,

(ini latihan 2.17 di halaman 49 dari ), atau hasil cerita rakyat lainnya :

(3)EZn=2logn+Θ(1).

Non-asimtotik, juga diketahui bahwa untuk setiap (lihat di sini untuk bukti),n

(4)clognEZn2logn

untuk sebagian kecil . Hasil serupa juga dapat ditampilkan untuk, karena sangat miring ke kanan.c|Zn|Zn

Bukti hasil terakhir ini jauh lebih mudah daripada bukti hasil lainnya. Harapan saya adalah bahwa hasil asimptotik pertama akan menyiratkan semua yang asimptotik lainnya, sehingga saya bisa merasa percaya diri memfokuskan seluruh waktu dan energi saya dalam memahami hasil itu. Tetapi, sekali lagi, itu tampaknya tidak benar , jadi sekarang tidak jelas bagi saya yang harus saya fokuskan.

Lihat halaman 265-267 dari edisi kedua Galambos, Teori Asymptotic of Extreme Order Statistics , dicetak pada tahun 1987. Mungkin juga dinyatakan di suatu tempat di edisi pertama.

Boucheron, Lugosi, Massart, Kesenjangan Konsentrasi: Teori Kemandirian Nonasimptotik . Selain: Buku ini sebenarnya mengutip Galambos untuk hasil yang dimaksud, tetapi saya tidak dapat menemukannya disebutkan di mana pun di Galambos - hanya hasil pertama yang saya sebutkan.


1
Apakah Anda tahu bahwa ketika Anda menggunakan \ dots di MathJax hasilnya terkadang muncul seolah-olah Anda telah menggunakan \ ldots dan kadang-kadang seolah-olah Anda menggunakan \ cdots, tergantung pada konteksnya? saya mengganti \ dots dengan \ ldots dalam pertanyaan ini.
X_1, \dots, X_n, \dots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)
Michael Hardy

@MichaelHardy Oh saya pikir itu selalu terpusat. Terima kasih untuk perbaikannya!
Chill2Macht

Jawaban:


4

Dalam setiap aplikasi probabilistik, objek yang paling mendasar adalah distribusi, dengan momen dan sifat pembatas yang diturunkan dari ini. Karenanya, hasil yang paling "penting", dalam arti yang telah Anda jelaskan, adalah fungsi distribusi penuh (ekuivalen, fungsi kerapatan yang sesuai). Dalam praktiknya, hasil distribusi ini mungkin kurang mencerahkan daripada beberapa sifat asimptotik yang lebih mendasar yang sudah Anda daftarkan. Meskipun secara logis menyiratkan hasil asimptotik ini, dalam pandangan saya, hasil tersebut cenderung lebih mencerahkan dalam memahami sifat perubahan dari nilai ekstrem saat kita berubah .FZn(z)=Φn(z)n

Jelas dari pertanyaan Anda bahwa Anda memiliki pemahaman yang baik tentang properti nilai ekstrem dalam kasus maksimum variabel acak normal standar IID. Semua properti ini secara logis dapat diturunkan dari fungsi distribusi untuk , sehingga itu adalah objek paling mendasar yang bekerja dalam masalah ini. Seperti dalam banyak kasus, objek yang paling mendasar belum tentu yang paling mencerahkan, dan Anda mungkin akan menemukan bahwa Anda harus puas dengan mengetahui semua hasil, dan mengetahui bahwa mereka menerangi berbagai aspek masalah.Zn


Terima kasih atas jawaban ini - Saya menghargainya. Apakah Anda tahu referensi tentang cara mendapatkan semua properti ini dari fungsi distribusi untuk ? Saya mengalami kesulitan yang luar biasa dalam menemukan apa pun yang menjelaskan hal ini, karena itu semua adalah "cerita rakyat" atau "pegangan tangan". Zn
Chill2Macht

Sebagai catatan, saya sudah membaca tautannya dan itu tidak membantu. Itu sebabnya saya bertanya.
Chill2Macht

1
Saya tidak memiliki referensi khusus untuk direkomendasikan, tetapi saya pikir hasil ini akan diturunkan dalam buku-buku tentang teori nilai ekstrim. Saya sarankan Anda mulai dengan mencari beberapa teks tingkat pascasarjana tentang subjek itu dan melihat apakah Anda dapat menemukan derivasi di sana.
Ben - Reinstate Monica

1

WIP: Pekerjaan sedang berlangsung

Mengikuti hal. 370 dari Metode Matematika Statistik Cramer 1946 , definisikanDi sini adalah fungsi distribusi kumulatif dari distribusi normal standar, . Sebagai konsekuensi dari definisinya, kami dijamin bahwa hampir pasti.

Ξn=n(1Φ(Zn)).
ΦN(0,1)0Ξnn

Pertimbangkan realisasi yang diberikan ruang sampel kami. Maka dalam pengertian ini adalah fungsi dari dan , dan adalah fungsi dari , dan . Untuk fix , kita dapat menganggap sebagai fungsi deterministik dari , dan fungsi deterministik dari dan , sehingga menyederhanakan masalah. Kami bertujuan untuk menampilkan hasil yang hampir pasti untuk semuaωΩZnnωΞnZn,nωωZnnΞnZnnωΩ, memungkinkan kami untuk mentransfer hasil kami dari analisis non-deterministik ke pengaturan non-deterministik.

Mengikuti hal. 374 dari Cramer's 1946 Metode Matematika Statistik, asumsikan untuk saat ini (saya bertujuan untuk kembali dan memberikan bukti nanti) bahwa kami dapat menunjukkan bahwa (untuk setiap ) yang diberikan ekspansi asimtotik berikut (menggunakan integrasi oleh bagian dan definisi ):ωΩΦ

(~)2πnΞn=1ZneZn22(1+O(1Zn2))  as  Zn.

Jelas kita memiliki untuk sembarang , dan hampir pasti merupakan fungsi yang meningkat dari sebagai , oleh karena itu kami mengklaim dalam apa yang diikuti selama itu untuk (hampir pasti semua) diperbaiki :Zn+1ZnnZnnnω

Znn.

Oleh karena itu mengikuti yang kita miliki (di mana menunjukkan kesetaraan asimptotik ):

2πnΞn1Zne1Zn2  as  Znn.

Bagaimana kita melanjutkan apa yang mengikuti pada dasarnya berjumlah pada metode keseimbangan dominan , dan manipulasi kita akan secara resmi dibenarkan oleh lemma berikut:

Lemma: Asumsikan bahwa sebagai , dan (dengan demikian ). Kemudian diberi fungsi yang dibentuk melalui komposisi, penambahan, dan penggandaan logaritma dan undang-undang kekuasaan (pada dasarnya fungsi " polylog "), kita juga harus memiliki itu sebagai :Dengan kata lain, fungsi "polylog" seperti itu mempertahankan kesetaraan asimptotik .f(n)g(n)nf(n)g(n)hn h ( f ( n ) ) h ( g ( n ) )n

h(f(n))h(g(n)).

Kebenaran dari lemma ini adalah konsekuensi dari Teorema 2.1. seperti yang tertulis di sini . Perhatikan juga bahwa yang berikut ini sebagian besar merupakan versi jawaban yang diperluas (lebih detail) untuk pertanyaan serupa yang ditemukan di sini .

Mengambil logaritma dari kedua belah pihak, kami mendapatkan bahwa:

(1)log(2πΞn)lognlogZnZn22.

Di sinilah Cramer agak cerdik; dia hanya mengatakan "dengan asumsi dibatasi", kita dapat menyimpulkan bla bla bla. Tetapi menunjukkan bahwa terikat dengan tepat hampir pasti tampaknya agak non-sepele. Tampaknya buktinya mungkin pada dasarnya menjadi bagian dari apa yang dibahas pada hlm. 265-267 dari Galambos, tetapi saya tidak yakin mengingat bahwa saya masih berusaha memahami isi buku itu.ΞnΞn

Lagi pula, dengan asumsi orang dapat menunjukkan bahwalogΞn=o(logn) , maka ia mengikuti (karena istilah mendominasi istilah ) bahwa:Zn2/2logZn

lognZn22Zn2logn.

Ini agak baik, karena sudah sebagian besar dari apa yang ingin kami tunjukkan, walaupun sekali lagi perlu dicatat bahwa pada dasarnya hanya menendang kaleng di jalan, karena sekarang kita harus menunjukkan beberapa tertentu dari . Di sisi lain, memiliki distribusi yang sama untuk setiap maksimum variabel acak kontinu iid, jadi ini dapat ditelusuri.ΞnΞn

Lagi pula, jika sebagai, maka jelas seseorang juga dapat menyimpulkan bahwa untuk setiap yaitu sebagai . Dengan menggunakan lemma kami tentang fungsi-fungsi polylog yang mempertahankan kesetaraan asimptotik di atas, kita dapat mengganti ungkapan ini kembali ke untuk mendapatkan:Zn2lognZn2logn(1+α(n))α(n)o(1)n(1)

log(2πΞn)lognlog(1+α)12log212loglognlogn2αlognα2logn.

log(Ξn2π)log(1+α)+12log2+12loglogn+2αlogn+α2logn.

Di sini kita harus melangkah lebih jauh, dan menganggap bahwa hampir pastilogΞn=o(loglogn)  as  n . Sekali lagi, semua yang dikatakan Cramer adalah "dengan asumsi terikat". Tetapi karena semua orang dapat mengatakan apriori tentang adalah seperti, hampir tidak jelas bahwa seseorang seharusnya memiliki hampir pasti, yang tampaknya merupakan substansi klaim Cramer.ΞnΞn0XinnΞn=O(1)

Tapi bagaimanapun, dengan asumsi orang percaya itu, maka berarti bahwa istilah dominan yang tidak mengandung adalah . Karena , berarti , dan dengan jelas , jadi istilah dominan yang mengandung adalah . Oleh karena itu, kita dapat mengatur ulang dan (membagi semuanya dengan atau ) menemukan bahwaα12loglognα=o(1)α2=o(α)log(1+α)=o(α)=o(o(αlogn))α2αlogn12loglogn2αlogn

12loglogn2αlognαloglogn4logn.

Oleh karena itu, dengan mengganti ini kembali ke yang di atas, kita dapat:

Zn2lognloglogn22logn,

lagi, dengan asumsi kami percaya hal-hal tertentu tentang .Ξn

Kami mengulangi teknik yang sama lagi; karena , maka itu juga mengikuti bahwaZn2lognloglogn22logn

Zn2lognloglogn22logn(1+β(n))=2logn(1loglogn8logn(1+β(n))),

ketika . Mari sederhanakan sedikit sebelum mengganti langsung kembali ke (1); kami mendapatkan itu:β(n)=o(1)

logZnlog(2logn)+log(1loglogn8logn(1+β(n)))log(O(1))=o(logn)log(2logn).

Zn22logn12loglogn(1+β)+(loglogn)28logn(1β)2o((1+β)loglogn)logn12(1+β)loglogn.

Mengganti ini menjadi (1), kami menemukan bahwa:

log(2πΞn)lognlog(2logn)logn+12(1+β)loglognβlog(4πΞn2)loglogn.

Karena itu, kami menyimpulkan itu hampir pasti

Zn2lognloglogn22logn(1+log(4π)+2log(Ξn)loglogn)=2lognloglogn+log(4π)22lognlog(Ξn)2logn.

Ini sesuai dengan hasil akhir pada hal.374 dari Cramer's 1946 Metode Matematika Statistik kecuali bahwa di sini urutan yang tepat dari istilah kesalahan tidak diberikan. Tampaknya menerapkan satu istilah lagi ini memberikan urutan yang tepat dari istilah kesalahan, tetapi bagaimanapun juga sepertinya tidak perlu untuk membuktikan hasil tentang maksimal dari standar normal iid di mana kami tertarik.


Mengingat hasil di atas, yaitu yang hampir pasti:

()Zn2lognloglogn+log(4π)22lognlog(Ξn)2lognZn=2lognloglogn+log(4π)22lognlog(Ξn)2logn+o(1).

2. Kemudian dengan linearitas harapan maka berikut:

EZn=2lognloglogn+log(4π)22lognE[log(Ξn)]2logn+o(1)EZn2logn=1E[logΞn]2logn+o(1).

Karena itu, kami telah menunjukkan itu

limnEZn2logn=1,

selama kita juga bisa menunjukkan itu

E[logΞn]=o(logn).

Ini mungkin tidak terlalu sulit untuk ditampilkan karena lagi memiliki distribusi yang sama untuk setiap variabel acak kontinu. Jadi kita mendapatkan hasil kedua dari atas.Ξn

1. Demikian pula, kami juga memiliki dari atas yang hampir pasti:

Zn2logn=1log(Ξn)2logn+o(1),.

Karena itu, jika kita dapat menunjukkan bahwa:

(*)log(Ξn)=o(logn) almost surely,

maka kita akan menunjukkan hasil pertama dari atas. Hasil (*) juga akan secara jelas menyiratkan fortiori bahwa , dengan demikian juga memberi kita hasil pertama dari atas.E[log(Ξn)]=o(logn)

Juga perhatikan bahwa dalam bukti di atas ( ) kita perlu mengasumsikan bahwa hampir pasti (atau setidaknya sesuatu yang serupa), sehingga jika kita dapat menunjukkan ( ) maka kita kemungkinan besar juga akan memiliki dalam proses yang diperlukan untuk menunjukkan hampir pasti, dan karena itu jika kita dapat membuktikan kita kemungkinan besar akan dapat segera mencapai semua kesimpulan berikut.Ξn=o(logn)Ξn=o(logn)()

3. Namun, jika kita memiliki hasil ini, maka saya tidak mengerti bagaimana kita juga akan memiliki itu , karena . Tetapi paling tidak tampaknya benar bahwaEZn=2logn+Θ(1)o(1)Θ(1)

EZn=2logn+O(1).


Jadi sepertinya kita bisa fokus menjawab pertanyaan tentang bagaimana menunjukkan bahwa

Ξn=o(logn) almost surely.

Kita juga perlu melakukan pekerjaan kasar memberikan bukti untuk (~), tetapi sejauh pengetahuan saya yang hanya kalkulus dan tidak melibatkan teori probabilitas, meskipun saya belum duduk dan mencobanya.

Pertama mari kita melalui rantai hal-hal sepele untuk menguraikan kembali masalah dengan cara yang membuatnya lebih mudah untuk dipecahkan (perhatikan bahwa menurut definisi ):Ξn0

Ξn=o(logn)limnΞnlogn=0ε>0,Ξnlogn>ε only finitely many timesε>0,Ξn>εlogn only finitely many times.

Seseorang juga memiliki itu:

Ξn>εlognn(1F(Zn))>εlogn1F(Zn)>εlognnF(Zn)<1εlognnZninf{y:F(y)1εlognn}.

Sejalan dengan itu, tentukan untuk semua :n

un(ε)=inf{y:F(y)1εlognn}.

Karena itu langkah-langkah di atas menunjukkan kepada kita bahwa:

Ξn=o(logn) a.s.P(Ξn=o(logn))=1P(ε>0,Ξn>εlogn only finitely many times)=1P(ε>0,Znun(ε) only finitely many times)=1P(ε>0,Znun(ε) infinitely often)=0.

Perhatikan bahwa kita dapat menulis:

{ε>0,Znun(ε) infinitely often}=ε>0{Znun(ε) infinitely often}.

Urutan menjadi lebih besar secara seragam ketika berkurang, sehingga kita dapat menyimpulkan bahwa peristiwa menurun (atau setidaknya entah bagaimana monoton) seperti pergi ke . Oleh karena itu aksioma probabilitas mengenai urutan peristiwa yang monoton memungkinkan kita untuk menyimpulkan bahwa:un(ε)ε

{Znun(ε) infinitely often}
ε0

P(ε>0,Znun(ε) infinitely often)=P(ε>0{Znun(ε) infinitely often})=P(limε0{Znun(ε) infinitely often})=limε0P(Znun(ε) infinitely often).

Karena itu cukup untuk menunjukkan bahwa untuk semua ,ε>0

P(Znun(ε) infinitely often)=0

karena tentu saja batas urutan konstan adalah konstan.

Berikut ini sedikit hasil palu godam:

Teorema 4.3.1., Hlm. 252 dari Galambos, Teori Asymptotic of Extreme Order Statistics , edisi ke-2. Misalkan menjadi variabel iid dengan fungsi distribusi nondegenerate dan kontinu umum , dan biarkan menjadi urutan sehingga juga tidak mengalami penurunan. Kemudian, untuk , sesuai dengan X1,X2,F(x)unn(1F(un))un<sup{x:F(x)<1}

P(Znun infinitely often)=0 or 1
j=1+[1F(uj)]exp(j[1F(uj)])<+ or =+.

Buktinya teknis dan memakan waktu sekitar lima halaman, tetapi pada akhirnya ternyata menjadi akibat dari salah satu lemmas Borel-Cantelli. Saya mungkin berusaha untuk menyingkat bukti untuk hanya menggunakan bagian yang diperlukan untuk analisis ini serta hanya asumsi yang berlaku dalam kasus Gaussian, yang mungkin lebih pendek (tapi mungkin tidak) dan ketik di sini, tapi menahan nafasmu tidak dianjurkan. Perhatikan bahwa dalam kasus ini , sehingga kondisinya kosong, dan adalah sehingga jelas tidak menurun.ω(F)=+n(1F(n))εlogn

Pokoknya intinya adalah itu, menarik bagi teorema ini, jika kita dapat menunjukkan bahwa:

j=1+[1F(uj(ε))]exp(j[1F(uj(ε))])=j=1+[εlogjj]exp(εlogj)=εj=1+logjj1+ε<+.

Perhatikan bahwa karena pertumbuhan logaritmik lebih lambat daripada pertumbuhan hukum daya untuk eksponen hukum daya positif mana pun (logaritma dan eksponensial bersifat melestarikan yang monoton, maka dan ketidaksetaraan sebelumnya selalu dapat dilihat untuk semua cukup besar karena fakta bahwa dan perubahan variabel), kita memiliki itu:loglognαlognlognnαnlognn

j=1+logjj1+εj=1+jε/2j1+ε=j=1+1j1+ε/2<+,

karena p-series diketahui konvergen untuk semua , dan tentu saja menyiratkan .p>1ε>01+ε/2>1

Dengan menggunakan teorema di atas kami telah menunjukkan bahwa untuk semua , , yang untuk rekapitulasi harus berarti bahwa hampir pasti.ε>0P(Znun(ε) i.o.)=0Ξn=o(logn)

Kita masih perlu menunjukkan bahwa . Ini tidak mengikuti dari atas, karena, misalnya,logΞn=o(loglogn)

1nlogn=o(logn),logn+loglogno(logn).

Namun, diberi urutan , jika seseorang dapat menunjukkan bahwa untuk arbitrary , maka ia mengikuti . Idealnya saya ingin dapat menunjukkan ini untuk menggunakan lemma di atas (dengan asumsi itu bahkan benar), tetapi saya tidak dapat (sampai sekarang).xnxn=o((logn)δ)δ>0log(xn)=o(loglogn)Ξn

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.