Jawaban ini berharap untuk memberikan makna intuitif teorema limit pusat, menggunakan teknik kalkulus sederhana (Taylor ekspansi orde 3). Inilah garis besarnya:
- Apa kata CLT
- Bukti intuitif dari CLT menggunakan kalkulus sederhana
- Kenapa distribusi normal?
Kami akan menyebutkan distribusi normal di bagian paling akhir; karena fakta bahwa distribusi normal akhirnya muncul tidak tahan banyak intuisi.
1. Apa yang dikatakan teorema limit pusat? Beberapa versi CLT
xX1,⋯,Xn
P(X1+⋯+Xnn−−√≤x)→n→+∞∫x−∞e−t2/22π−−√dt.
X1.,…,XnZ1,…,ZnE[f(X1+⋯+Xnn√)]−E[f(Z1+⋯+Znn√)]→n→+∞0
fxf(t)={1 if t<x0 if t≥x.
X1,…,XnZ1,…,Zn
Beberapa versi lain dari CLT menyebutkan kelas fungsi Lipschtiz yang dibatasi oleh 1; beberapa versi lain dari CLT menyebutkan kelas fungsi halus dengan turunan terbatas dari order . Pertimbangkan dua urutan dan seperti di atas, dan untuk beberapa fungsi , hasil konvergensi (CONV)kX1,…,XnZ1,…,Znf
E[f(X1+⋯+Xnn√)]−E[f(Z1+⋯+Znn√)]→n→+∞0(CONV)
Dimungkinkan untuk menetapkan kesetaraan ("jika dan hanya jika") antara pernyataan berikut:
- (CONV) di atas berlaku untuk setiap fungsi indikator dari bentuk untuk dan untuk untuk beberapa real tetap .ff(t)=1t<xf(t)=0t≥xx
- (CONV) berlaku untuk setiap dibatasi fungsi Lipschitz .f:R→R
- (CONV) berlaku untuk setiap fungsi halus (yaitu, ) dengan dukungan yang ringkas.C∞
- (CONV) berlaku untuk setiap fungsi tiga kali dapat dibedakan secara terus menerus dengan .fsupx∈R|f′′′(x)|≤1
Masing-masing dari 4 poin di atas mengatakan bahwa konvergensi berlaku untuk kelas fungsi yang besar. Dengan argumen pendekatan teknis, orang dapat menunjukkan bahwa keempat poin di atas adalah setara, kami merujuk pembaca ke Bab 7, halaman 77 dari buku David Pollard. Panduan pengguna untuk mengukur probabilitas teoretis dari mana jawaban ini sangat terinspirasi.
Asumsi kami untuk sisa jawaban ini ...
Kami akan menganggap bahwa untuk beberapa konstanta , yang sesuai dengan poin 4 di atas. Kami juga akan mengasumsikan bahwa variabel acak memiliki terbatas, dibatasi momen ketiga: dan
adalah terbatas.supx∈R|f′′′(x)|≤CC>0E[|Xi|3]E[|Zi|3]
2. Nilai bersifat universal: tidak bergantung pada distribusiE[f(X1+⋯+Xnn√)]X1,...,Xn
Mari kita tunjukkan bahwa kuantitas ini bersifat universal (hingga istilah kesalahan kecil), dalam arti tidak tergantung pada kumpulan variabel acak independen mana yang disediakan. Ambil dan dua urutan variabel acak independen, masing-masing dengan mean 0 dan varians 1, dan momen ketiga terbatas.X1,…,XnZ1,…,Zn
Idenya adalah untuk mengganti dengan secara dalam salah satu kuantitas dan mengendalikan perbedaan dengan kalkulus dasar (idenya, saya percaya, adalah karena Lindeberg). Dengan ekspansi Taylor, jika , dan maka
mana danXiZiW=Z1+⋯+Zn−1h(x)=f(x/n−−√)h(Z1+⋯+Zn−1+Xn)h(Z1+⋯+Zn−1+Zn)=h(W)+Xnh′(W)+X2nh′′(W)2+X3n/h′′′(Mn)6=h(W)+Znh′(W)+Z2nh′′(W)2+Z3nh′′′(M′n)6
MnM′nadalah titik tengah yang diberikan oleh teorema nilai rata-rata. Mengambil ekspektasi pada kedua baris, syarat urutan adalah sama, ketentuan urutan pertama sama dalam ekspektasi karena dengan independensi dan , dan juga untuk baris kedua. Sekali lagi dengan kemerdekaan, syarat orde kedua sama dalam ekspektasi. Satu-satunya istilah yang tersisa adalah urutan ketiga, dan dengan harapan perbedaan antara dua baris paling banyak adalah
Di sini adalah batas atas pada turunan ketiga dari . Penyebut muncul karenaXnWE[Xnh′(W)]=E[Xn]E[h′(W)]=0
(C/6)E[|Xn|3+|Zn|3](n−−√)3.
Cf′′′(n−−√)3h′′′(t)=f′′′(t/n−−√)/(n−−√)3 .
Dengan independensi, kontribusi dalam jumlah tidak ada artinya karena dapat digantikan oleh tanpa menimbulkan kesalahan yang lebih besar dari tampilan di atas!XnZn
Kami sekarang mengulangi untuk mengganti dengan . Jika maka
Dengan independensi dan , dan dengan independensi danXn−1Zn−1W~=Z1+Z2+⋯+Zn−2+Xnh(Z1+⋯+Zn−2+Xn−1+Xn)h(Z1+⋯+Zn−2+Zn−1+Xn)=h(W~)+Xn−1h′(W~)+X2n−1h′′(W~)2+X3n−1/h′′′(M~n)6=h(W~)+Zn−1h′(W~)+Z2n−1h′′(W~)2+Z3n−1/h′′′(M~n)6.
Zn−1W~Xn−1W~, sekali lagi, nol, ketentuan urutan pertama dan kedua sama dalam ekspektasi untuk kedua jalur. Perbedaan dalam harapan antara kedua baris paling banyak lagi adalah
Kami terus mengulangi sampai kami mengganti semua dengan . Dengan menambahkan kesalahan yang dibuat pada setiap langkah , kita memperoleh
sebagai
(C/6)E[|Xn−1|3+|Zn−1|3](n−−√)3.
ZiXin∣∣E[f(X1+⋯+Xnn√)]−E[f(Z1+⋯+Znn√)]∣∣≤n(C/6)maxi=1,…,nE[|Xi|3+|Zi|3](n−−√)3.
nmeningkat, sisi kanan menjadi sewenang-wenang kecil jika momen ketiga atau variabel acak terbatas (mari kita asumsikan demikian). Ini berarti bahwa harapan di sebelah kiri menjadi dekat secara sewenang-wenang satu sama lain, tidak peduli apakah distribusi jauh dari .
Dengan independensi, kontribusi setiap dalam jumlah tidak ada artinya karena dapat digantikan oleh tanpa menimbulkan kesalahan yang lebih besar dari .
Dan mengganti semua dengan tidak mengubah kuantitas lebih dari .
X1,…,XnZ1,…,ZnXiZiO(1/(n−−√)3)XiZiO(1/n−−√)
Harapan bersifat universal, tidak bergantung pada distribusi . Di sisi lain, independensi dan adalah yang paling penting untuk batas-batas di atas.E[f(X1+⋯+Xnn√)]X1,…,XnE[Xi]=E[Zi]=0,E[Z2i]=E[X2i]=1
3. Mengapa distribusi normal?
Kita telah melihat bahwa ekspektasi akan tetap sama tidak peduli apa pun distribusi , hingga kesalahan pesanan kecil .E[f(X1+⋯+Xnn√)]XiO(1/n−−√)
Tetapi untuk aplikasi, akan berguna untuk menghitung jumlah tersebut. Hal ini juga akan berguna untuk mendapatkan ekspresi sederhana untuk kuantitas ini .E[f(X1+⋯+Xnn√)]
Karena jumlah ini sama untuk setiap koleksi , kami dapat dengan mudah memilih satu koleksi tertentu sehingga distribusi mudah untuk dihitung atau diingat.X1,…,Xn(X1+⋯+Xn)/n−−√
Untuk distribusi normal , kebetulan jumlah ini menjadi sangat sederhana. Memang, jika adalah iid maka juga memiliki distribusi dan tidak bergantung pada ! Karenanya jika , maka
dan dengan argumen di atas, untuk kumpulan variabel acak independen dengan , laluN(0,1)Z1,…,ZnN(0,1)Z1+⋯+Znn√N(0,1)nZ∼N(0,1)
E[f(Z1+⋯+Znn−−√)]=E[f(Z)],
X1,…,XnE[Xi]=0,E[X2i]=1
∣∣∣E[f(X1+⋯+Xnn−−√)]−E[f(Z)∣∣∣≤supx∈R|f′′′(x)|maxi=1,…,nE[|Xi|3+|Z|3]6n−−√.