The pernyataan klasik dari Central Teorema Limit (CLT) menganggap urutan independen, variabel acak terdistribusi secara identik dengan distribusi umum . Urutan ini memodelkan situasi yang kita hadapi ketika merancang program sampling atau percobaan: jika kita dapat memperoleh pengamatan independen terhadap fenomena mendasar yang sama, maka koleksi hingga memodelkan data yang diantisipasi. Mengizinkan urutan menjadi tak terbatas adalah cara yang mudah untuk merenungkan ukuran sampel yang besar dan sewenang-wenang.X1,X2, ... ,Xn, ...FnX1,X2, ... ,Xn
Berbagai undang-undang dalam jumlah besar menegaskan hal itu
m (X1,X2, ... ,Xn) =1n(X1+X2+ ⋯ +Xn)
akan mendekati harapan , , dengan probabilitas tinggi, asalkan benar-benar memiliki harapan. (Tidak semua distribusi melakukan.) Ini menyiratkan penyimpangan (yang, sebagai fungsi dari variabel acak ini, juga merupakan variabel acak) akan cenderung mendapatkan lebih kecil dengan meningkatnya . CLT menambahkan ini dengan cara yang jauh lebih spesifik: ia menyatakan (dalam beberapa kondisi, yang akan saya bahas di bawah) bahwa jika kita penyimpangan ini dengan , ia akan memiliki fungsi distribusi yang mendekati beberapa nol- berarti fungsi distribusi normal sebagaiFμ ( F)Fm (X1,X2, ... ,Xn) - μ ( F)nnn--√Fnntumbuh besar. (Jawaban saya di https://stats.stackexchange.com/a/3904 berupaya menjelaskan mengapa ini dan mengapa faktor adalah yang tepat untuk digunakan.)n--√
Ini bukan pernyataan standar CLT. Mari kita hubungkan dengan yang biasa. Distribusi Normal nol-rata yang membatasi akan sepenuhnya ditentukan oleh parameter kedua, yang biasanya dipilih sebagai ukuran penyebarannya (secara alami!), Seperti varians atau standar deviasi. Biarkan menjadi variansnya. Tentunya itu harus memiliki beberapa hubungan dengan properti yang sama dari . Untuk menemukan apa ini, biarkan memiliki varian - yang mungkin tak terbatas, omong-omong. Apapun, karena independen, kami dengan mudah menghitung varians cara:σ2FFτ2Xsaya
Var ( m (X1,X2, ... ,Xn) )= Var (1n(X1+X2+ ⋯ +Xn) )=(1n)2( Var (X1) + Var (X2) + ⋯ + Var (Xn) )=(1n)2(τ2+τ2+ ⋯ +τ2)=τ2n.
Akibatnya, varians dari residu terstandarisasi sama dengan : konstan. Varian dari distribusi Normal yang membatasi, kemudian, harus itu sendiri. (Ini segera menunjukkan bahwa teorema hanya dapat bertahan ketika adalah terbatas: itu adalah asumsi tambahan yang saya singgung sebelumnya.)τ2/ n×(n--√)2=τ2τ2τ2
(Jika kita telah memilih ukuran penyebaran kita masih bisa berhasil menghubungkannya ke , tetapi kita tidak akan menemukan bahwa ukuran penyebaran deviasi rata-rata terstandarisasi adalah konstan untuk semua , yaitu yang indah - meskipun tidak penting - penyederhanaan.)Fσ2n
Jika kita mau, kita bisa menstandarkan deviasi rata-rata selama ini dengan membaginya dengan serta mengalikannya dengan . Itu akan memastikan distribusi pembatas adalah standar Normal, dengan varian unit. Apakah Anda memilih untuk membakukan oleh cara ini atau tidak benar-benar masalah selera: itu teorema yang sama dan kesimpulan yang sama pada akhirnya. Yang penting adalah perkalian dengan .τn−−√τn−−√
Perhatikan bahwa Anda dapat mengalikan penyimpangan dengan beberapa faktor selain . Anda dapat menggunakan , atau , atau apa pun yang berperilaku asimtotik seperti . Setiap bentuk asimptotik lainnya akan, dalam batasnya, mengurangi menjadi atau meledakkannya hingga . Pengamatan ini menyempurnakan apresiasi kami terhadap CLT dengan menunjukkan sejauh mana fleksibel mengenai bagaimana standardisasi dilakukan. Kami mungkin ingin menyatakan CLT, kemudian, dengan cara berikut.n−−√n−−√+exp(−n)n1/2+1/nn−−√σ20∞
Asalkan penyimpangan antara rata-rata urutan variabel IID (dengan distribusi umum ) dan harapan yang mendasari diskalakan secara asimptot oleh , deviasi berskala ini akan memiliki distribusi pembatas Normal rata-rata nol yang variansinya adalah dari .Fn−−√F
Meskipun varians yang terlibat dalam pernyataan, mereka muncul hanya karena mereka dibutuhkan untuk mengkarakterisasi distribusi normal membatasi dan berhubungan penyebarannya dengan yang . Ini hanya aspek insidentil. Ini tidak ada hubungannya dengan varian menjadi "terbaik" dalam arti apa pun. Inti dari masalah ini adalah penyelamatan asimptotik oleh .Fn−−√