Dengan informasi yang diberikan oleh @Glen_b saya bisa menemukan jawabannya. Menggunakan notasi yang sama dengan pertanyaan
P(Zk≤x)=∑j=0k+1(k+1j)(−1)j(1−jx)k+,
di mana a+=a jika a>0 dan 0 sebaliknya. Saya juga memberikan ekspektasi dan konvergensi asimptotik pada distribusi Gumbel ( NB : bukan Beta)
E(Zk)=1k+1∑i=1k+11i∼log(k+1)k+1,P(Zk≤x)∼exp(−e−(k+1)x+log(k+1)).
Bahan bukti diambil dari beberapa publikasi yang terhubung dalam referensi. Mereka agak panjang, tapi langsung.
1. Bukti distribusi yang tepat
Misalkan menjadi variabel acak seragam IID dalam interval . Dengan memesannya , kami memperoleh statistik order yang dilambangkan . Jarak seragam didefinisikan sebagai , dengan dan . Spasi yang diurutkan adalah statistik yang diurutkan sesuai . Variabel yang menarik adalah .(U1,…,Uk)(0,1)k(U(1),…,U(k))Δi=U(i)−U(i−1)U(0)=0U(k+1)=1 Δ ( k + 1 )Δ(1)≤…≤Δ(k+1)Δ(k+1)
Untuk tetap> , kami mendefinisikan variabel indikator . Secara simetri, vektor acak dapat ditukar, sehingga distribusi gabungan dari subset ukuran adalah sama dengan distribusi gabungan dari pertama . Dengan memperluas produk, dengan demikian kita memperoleh1 i = 1 { Δ i > x } ( 1 1 , ... , 1 k + 1 ) j jx∈(0,1)1i=1{Δi>x}(11,…,1k+1)jj
P( Δ( k + 1 )≤ x ) = E( ∏i = 1k + 1( 1 - 1saya) ) = 1 + ¢j = 1k + 1( k+1j) (-1)jE( ∏i = 1j1saya) .
Kami sekarang akan membuktikan bahwa , yang akan menetapkan distribusi yang diberikan di atas. Kami membuktikan ini untuk , karena kasus umum terbukti sama. j = 2E( ∏ji = 11saya) =(1-jx )k+j = 2
E( ∏i = 121saya) =P( Δ1> x ∩ Δ2> x ) = P( Δ1> x ) P( Δ2> x | Δ1>x).
Jika , breakpoints berada dalam interval . Secara kondisional pada peristiwa ini, breakpoints masih dapat ditukar, sehingga probabilitas bahwa jarak antara breakpoint kedua dan pertama lebih besar dari sama dengan probabilitas bahwa jarak antara breakpoint pertama dan penghalang kiri (pada posisi ) lebih besar dari . Begituk ( x , 1 ) x x xΔ1>xk(x,1)xxx
P(Δ2>x|Δ1>x)=P(all points are in (2x,1)∣∣all points are in (x,1)),soP(Δ2>x∩Δ1>x)=P(all points are in (2x,1))=(1−2x)k+.
2. Ekspektasi
Untuk distribusi dengan dukungan terbatas, kita harus
E(X)=∫P(X>x)dx=1−∫P(X≤x)dx.
Mengintegrasikan distribusi , kita memperolehΔ(k+1)
E(Δ(k+1))=1k+1∑j=1k+1(k+1j)(−1)j+1j=1k+1∑j=1k+11j.
Kesetaraan terakhir adalah representasi klasik dari angka harmonik , yang kami tunjukkan di bawah ini.Hi=1+12+…+1i
Hk+1=∫101+x+…+xkdx=∫101−xk+11−xdx.
Dengan perubahan variabel dan memperluas produk, kita memperolehu=1−x
Hk+1=∫10∑j=1k+1(k+1j)(−1)j+1uj−1du=∑j=1k+1(k+1j)(−1)j+1j.
3. konstruksi Alternatif jarak seragam
Untuk mendapatkan distribusi asimtotik dari fragmen terbesar, kita perlu menunjukkan konstruksi klasik jarak seragam sebagai variabel eksponensial dibagi dengan jumlah mereka. Kepadatan probabilitas dari statistik pesanan terkait adalah(U(1),…,U(k))
fU(1),…U(k)(u(1),…,u(k))=k!,0≤u(1)≤…≤u(k+1).
Jika kita menunjukkan spasi yang seragam , dengan , kita memperoleh U ( 0 ) = 0Δi=U(i)−U(i−1)U(0)=0
fΔ1, ... Δk( δ1, ... , δk) = k ! ,0 ≤ δsaya+ ... + δk≤ 1.
Dengan mendefinisikan , dengan demikian kita memperolehU( k + 1 )= 1
fΔ1, ... Δk + 1( δ1, ... , δk + 1) = k ! ,δ1+ ... + δk= 1.
Sekarang, mari menjadi variabel acak eksponensial IID dengan rata-rata 1, dan biarkan . Dengan perubahan variabel sederhana, kita bisa melihatnyaS = X 1 + ... + X k + 1( X1, ... , Xk + 1)S= X1+ ... + Xk + 1
fX1, ... Xk, S( x1, ... , xk,s)=e−s.
Tentukan , sehingga oleh perubahan variabel kita memperolehYi=Xi/S
fY1,…Yk,S(y1,…,yk,s)=ske−s.
Mengintegrasikan density ini sehubungan dengan , dengan demikian kita memperolehs
fY1,…Yk,(y1,…,yk)=∫∞0ske−sds=k!,0≤yi+…+yk≤1,and thusfY1,…Yk+1,(y1,…,yk+1)=k!,y1+…+yk+1=1.
Jadi distribusi bersama jarak seragam pada interval adalah sama dengan distribusi bersama variabel acak eksponensial dibagi dengan jumlah mereka. Kami sampai pada kesetaraan distribusi berikut( 0 , 1 ) k + 1k+1(0,1)k+1
Δ(k+1)≡X(k+1)X1+…+Xk+1.
4. Distribusi asimptotik
Dengan menggunakan persamaan di atas, kami memperoleh
P((k+1)Δ(k+1)−log(k+1)≤x)=P(X(k+1)≤(x+log(k+1))X1+…+Xk+1k+1)=P(X(k+1)−log(k+1)≤x+(x+log(k+1))Tk+1),
di mana . Variabel ini menghilang dalam probabilitas karena dan . Secara asimptotik, distribusinya sama dengan . Karena adalah IID, kami punyaTk+1=X1+…+Xk+1k+1−1E( Tk + 1) = 0Va r ( log( k + 1 ) Tk + 1) = ( log( k + 1 ) )2k + 1↓ 0X( k + 1 )- log( k + 1 )Xsaya
P(X(k+1)−log(k+1)≤x)=P(X1≤x+log(k+1))k+1=(1−e−x−log(k+1))k+1=(1−e−xk+1)k+1∼exp{−e−x}.
5. Tinjauan grafis
Plot di bawah ini menunjukkan distribusi fragmen terbesar untuk nilai berbeda . Untuk , saya juga menimpakan distribusi Gumbel asimptotik (garis tipis). Gumbel adalah perkiraan yang sangat buruk untuk nilai-nilai kecil jadi saya menghilangkannya untuk tidak membebani gambar. Perkiraan Gumbel baik dari .kk=10,20,50kk≈50
6. Referensi
Bukti di atas diambil dari referensi 2 dan 3. Literatur yang dikutip memuat lebih banyak hasil, seperti distribusi ruang yang dipesan dari peringkat apa pun, distribusi batasnya dan beberapa konstruksi alternatif dari jarak seragam yang dipesan. Referensi utama tidak mudah diakses, jadi saya juga menyediakan tautan ke teks lengkap.
- Bairamov et al. (2010) Batasi hasil untuk penempatan seragam yang teratur , makalah Stat, 51: 1, hal 227-240
- Holst (1980) Pada panjang potongan-potongan tongkat patah secara acak , J. Appl. Prob., 17, hlm 623-634
- Pyke (1965) Spasi , JRSS (B) 27: 3, hlm. 395-449
- Renyi (1953) Tentang teori statistik pesanan , Acta math Hung, 4, hlm 191-231