Ringkasan
Anda telah menemukan kembali bagian dari konstruksi yang dijelaskan di Teorema Batas Tengah untuk Sampel Median , yang menggambarkan analisis median sampel. (Analisis ini jelas berlaku, mutatis mutandis , untuk setiap kuantil, bukan hanya median). Oleh karena itu tidak mengherankan bahwa untuk parameter Beta besar (sesuai dengan sampel besar) distribusi normal muncul di bawah transformasi yang dijelaskan dalam pertanyaan. Yang menarik adalah seberapa dekat dengan Normal distribusi bahkan untuk parameter Beta kecil . Itu pantas penjelasan.
Saya akan membuat sketsa analisis di bawah ini. Untuk menjaga agar posting ini tidak masuk akal, ini melibatkan banyak gerakan tangan yang sugestif: Saya hanya bertujuan untuk menunjukkan ide-ide kunci. Oleh karena itu saya rangkum hasilnya di sini:
Ketika dekat dengan β , semuanya simetris. Ini menyebabkan distribusi yang ditransformasikan sudah terlihat Normal.αβ
Fungsi dari bentuk terlihat cukup normal di tempat pertama, bahkan untuk nilai α dan β yang kecil (asalkan melebihi 1 dan rasionya tidak terlalu dekat dengan 0 atau 1 ).Φα−1(x)(1−Φ(x))β−1αβ101
Normalitas semu dari distribusi yang ditransformasikan adalah karena fakta bahwa kerapatannya terdiri dari kerapatan Normal yang dikalikan dengan fungsi dalam (2).
Sebagai dan β meningkat, keberangkatan dari Normalitas dapat diukur dalam istilah sisanya dalam seri Taylor untuk kepadatan log. Istilah order n menurun sebanding dengan ( n - 2 ) / 2 kekuasaan α dan β . Ini menyiratkan bahwa pada akhirnya, untuk α dan β yang cukup besar , semua istilah daya n = 3 atau lebih besar telah menjadi relatif kecil, hanya menyisakan kuadrat: yang merupakan kepadatan log dari distribusi Normal.αβn(n−2)/2αβαβn=3
Secara kolektif, perilaku ini dengan baik menjelaskan mengapa bahkan untuk dan β kecil, kuantil non-ekstrem dari sampel Normal iid terlihat mendekati Normal.αβ
Analisis
Karena dapat berguna untuk menggeneralisasi, misalkan adalah fungsi distribusi apa pun , walaupun kami memiliki pemikiran F = ΦFF=Φ .
Fungsi kerapatan dari variabel Beta ( α , β ) , menurut definisi, sebanding dengang(y)(α,β)
yα−1(1−y)β−1dy.
Membiarkan menjadi transformasi integral tak terpisahkan dari x dan menulis f untuk turunan dari F , adalah langsung bahwa x memiliki kerapatan sebanding dengany=F(x)xfFx
G(x;α,β)=F(x)α−1(1−F(x))β−1f(x)dx.
Karena ini adalah transformasi monoton dari distribusi yang sangat unimodal (Beta), kecuali agak aneh, distribusi yang ditransformasikan juga akan unimodal. Untuk mempelajari seberapa dekat dengan Normal, mari kita periksa logaritma densitasnya,F
logG(x;α,β)=(α−1)logF(x)+(β−1)log(1−F(x))+logf(x)+C(1)
dimana C adalah konstanta normalisasi yang tidak relevan.
Perluas komponen dalam seri Taylor untuk memesan tiga di sekitar nilai x 0 (yang akan dekat dengan mode). Sebagai contoh, kita dapat menulis ekspansi log F sebagailogG(x;α,β)x0logF
logF(x)=cF0+cF1(x−x0)+cF2(x−x0)2+cF3h3
untuk beberapa dengan | h | ≤ | x - x 0 | . Gunakan notasi serupa untuk log ( 1 - F ) dan log f . h|h|≤|x−x0|log(1−F)logf
Istilah linear
Istilah linear dalam dengan demikian menjadi(1)
g1(α,β)=(α−1)cF1+(β−1)c1−F1+cf1.
Ketika adalah mode G (x0 , ungkapan ini adalah nol. Perhatikan bahwa karena koefisien adalah fungsi kontinu dari x 0 , karena α dan β bervariasi, mode x 0 akan bervariasi terus menerus juga. Selain itu, setelah α dan β yang cukup besar, yang c f 1 jangka menjadi relatif tidak penting. Jika kita bertujuan untuk mempelajari batas sebagai α → ∞ dan β → ∞ yang α : β tetap dalam proporsi konstan γG(;α,β)x0αβx0αβcf1α→∞β→∞ α:βγ, karena itu kami dapat sekali dan untuk semua memilih titik dasar yang manax0
γcF1+c1−F1=0.
Kasus yang bagus adalah di mana , di mana α = β di seluruh, dan F simetris tentang 0 . Dalam hal itu jelas x 0 = F ( 0 ) = 1 / 2γ=1α=βF0x0=F(0)=1/2 .
Kami telah mencapai metode di mana (a) dalam batas, istilah orde pertama dalam deret Taylor menghilang dan (b) dalam kasus khusus yang baru saja dijelaskan, istilah orde pertama selalu nol.
Istilah kuadratik
These are the sum
g2(α,β)=(α−1)cF2+(β−1)c1−F2+cf2.
Comparing to a Normal distribution, whose quadratic term is −(1/2)(x−x0)2/σ2, we may estimate that −1/(2g2(α,β)) is approximately the variance of G. Let us standardize G by rescaling x by its square root. we don't really need the details; it suffices to understand that this rescaling is going to multiply the coefficient of (x−x0)n(−1/(2g2(α,β)))n/2.
Remainder term
Here's the punchline: the term of order n in the Taylor expansion is, according to our notation,
gn(α,β)=(α−1)cFn+(β−1)c1−Fn+cfn.
After standardization, it becomes
g′n(α,β)=gn(α,β)(−2g2(α,β))n/2).
Both of the gi are affine combination of α and β. By raising the denominator to the n/2 power, the net behavior is of order −(n−2)/2 in each of α and β. As these parameters grow large, then, each term in the Taylor expansion after the second decreases to zero asymptotically. In particular, the third-order remainder term becomes arbitrarily small.
The case when F is normal
The vanishing of the remainder term is particularly fast when F is standard Normal, because in this case f(x) is purely quadratic: it contributes nothing to the remainder terms. Consequently, the deviation of G from normality depends solely on the deviation between Fα−1(1−F)β−1 and normality.
This deviation is fairly small even for small α and β. To illustrate, consider the case α=β. G is symmetric, whence the order-3 term vanishes altogether. The remainder is of order 4 in x−x0=x.
Here is a plot showing how the standardized fourth order term changes with small values of α>1:
The value starts out at 0 for α=β=1, because then the distribution obviously is Normal (Φ−1 applied to a uniform distribution, which is what Beta(1,1) is, gives a standard Normal distribution). Although it increases rapidly, it tops off at less than 0.008--which is practically indistinguishable from zero. After that the asymptotic reciprocal decay kicks in, making the distribution ever closer to Normal as α increases beyond 2.