Apakah ada contoh di mana teorema limit pusat tidak berlaku?


32

Wikipedia mengatakan -

Dalam teori probabilitas, teorema limit pusat (CLT) menetapkan bahwa, dalam sebagian besar situasi , ketika variabel acak independen ditambahkan, jumlah normalnya yang normal cenderung mengarah ke distribusi normal (secara informal merupakan "kurva lonceng") bahkan jika variabel asli sendiri tidak terdistribusi normal ...

Ketika dikatakan "dalam kebanyakan situasi", dalam situasi apa teorema limit pusat tidak berfungsi?

Jawaban:


33

Untuk memahami ini, Anda harus menyatakan versi pertama dari Teorema Limit Pusat. Inilah pernyataan "tipikal" dari teorema limit pusat:

Lindeberg – Lévy CLT. Misalkan X1,X2, adalah urutan variabel acak iid dengan E[Xi]=μ dan Var[Xi]=σ2< . Misalkan Sn:=X1++Xnn . Kemudian saat nmendekati tak terhingga, variabel acakn(Snμ)konvergen dalam distribusi kenormal(0,σ2)N(0,σ2)yaitu

n((1ni=1nXi)μ) d N(0,σ2).

Jadi, bagaimana ini berbeda dari deskripsi informal, dan apa kesenjangannya? Ada beberapa perbedaan antara deskripsi informal Anda dan deskripsi ini, beberapa di antaranya telah dibahas dalam jawaban lain, tetapi tidak sepenuhnya. Jadi, kita dapat mengubahnya menjadi tiga pertanyaan spesifik:

  • Apa yang terjadi jika variabel tidak terdistribusi secara identik?
  • Bagaimana jika variabel memiliki varian tak terbatas, atau rata-rata tak terbatas?
  • Seberapa pentingkah independensi?

Mengambil satu per satu,

Tidak terdistribusi secara identik , Hasil umum terbaik adalah versi Lindeberg dan Lyaponov dari teorema limit pusat. Pada dasarnya, selama standar deviasi tidak tumbuh terlalu liar, Anda bisa mendapatkan teorema batas pusat yang layak darinya.

Lyapunov CLT. [5] Misalkan nilai adalah urutan variabel acak independen, masing-masing dengan terbatas diharapkan μ i dan varians σ 2 Define: s 2 n = Σ n i = 1 σ 2 iX1,X2,μiσ2sn2=i=1nσi2

δ>0Xi-μi/snlimn1sn2+δi=1nE[|Xiμi|2+δ]=0Xiμi/sn

1sni=1n(Xiμi) d N(0,1).

Teorema Infinite Variance mirip dengan teorema limit pusat ada untuk variabel dengan varian infinite, tetapi kondisinya secara signifikan lebih sempit daripada teorema limit pusat biasa. Intinya, ekor dari distribusi probabilitas harus asimtotik ke untuk . Dalam hal ini, KTT berskala yang sesuai menyatu ke distribusi stabil Levy-Alpha .|x|α10<α<2

Pentingnya Kemandirian Ada banyak teorema limit pusat yang berbeda untuk sekuens non-independen . Mereka semua sangat kontekstual. Seperti yang ditunjukkan oleh Batman, ada satu untuk Martingales. Pertanyaan ini adalah bidang penelitian yang sedang berlangsung, dengan banyak variasi yang berbeda tergantung pada konteks minat tertentu. Pertanyaan tentang Pertukaran Matematika ini adalah pos lain yang terkait dengan pertanyaan ini.Xi


2
Saya telah menghapus "" "nyasar dari formula yang saya pikir telah merangkak masuk karena sistem kuotasi - jangan ragu untuk membalikkan edit saya jika itu disengaja!
Silverfish

CLT array segitiga mungkin CLT yang lebih representatif daripada yang dinyatakan. Sedangkan untuk tidak independen, martingale CLT adalah kasus yang cukup umum digunakan.
Batman

@ Bosman, apa contoh dari array segitiga CLT? Merasa bebas untuk mengedit respons saya, untuk menambahkannya. Saya tidak terbiasa dengan yang itu.
John


1
"selama standar deviasi tidak tumbuh terlalu liar" Atau menyusut (misalnya: )σi2=σi12/2
leonbloy

21

Meskipun saya cukup yakin bahwa itu telah dijawab sebelumnya, ini satu lagi:

Ada beberapa versi dari teorema limit pusat, yang paling umum adalah yang diberikan fungsi kepadatan probabilitas arbitrer, jumlah variabel akan didistribusikan secara normal dengan nilai rata-rata sama dengan jumlah nilai rata-rata, serta varians menjadi jumlah dari varian individual.

Kendala yang sangat penting dan relevan adalah bahwa mean dan varian pdf yang diberikan harus ada dan harus terbatas.

Jadi, ambil saja pdf apa pun tanpa nilai rata-rata atau varian - dan teorema batas pusat tidak akan berlaku lagi. Jadi, ambil distribusi Lorentzian misalnya.


+1 Atau ambil distribusi dengan varian tak terbatas, seperti distribusi jalan acak.
Alexis

2
@Alexis - dengan asumsi Anda melihat acak berjalan pada titik yang terbatas dalam waktu, saya akan berpikir itu akan memiliki varians yang terbatas, menjadi jumlah langkah iid masing-masing dengan varians terbatasn
Henry

1
@ Henry: Tidak, saya tidak mengasumsikan pada suatu titik waktu, tetapi varian dari distribusi semua jalan acak yang mungkin dari panjang yang tak terbatas.
Alexis

1
@Alexis Jika setiap langkah dari jalan acak adalah atau iid dengan probabilitas yang sama dan posisinya adalah maka Teorema Limit Pusat menyiratkan dengan benar bahwa sebagai Anda memiliki distribusi konvergen distribusi keXi+11Yn=1nXin N(0,1)n(1nYn)=YnnN(0,1)
Henry

1
@Alexis Tidak masalah untuk CLT, karena setiap distribusi individu masih memiliki varian yang terbatas.
Cubic

15

Tidak, CLT selalu berlaku ketika asumsi itu berlaku. Kualifikasi seperti "dalam sebagian besar situasi" adalah referensi informal ke kondisi di mana CLT harus diterapkan.

Misalnya, kombinasi linear dari variabel independen dari distribusi Cauchy tidak akan bertambah hingga variabel terdistribusi normal . Salah satu alasannya adalah bahwa varians tidak terdefinisi untuk distribusi Cauchy , sementara CLT menempatkan kondisi tertentu pada varians, misalnya bahwa itu harus terbatas. Implikasi yang menarik adalah bahwa karena simulasi Monte Carlo dimotivasi oleh CLT, Anda harus berhati-hati dengan simulasi Monte Carlo ketika berhadapan dengan distribusi ekor gemuk, seperti Cauchy.

Perhatikan, bahwa ada versi umum dari CLT. Ia bekerja untuk varian tak terbatas atau tidak terdefinisi, seperti distribusi Cauchy. Tidak seperti banyak distribusi yang berperilaku baik, jumlah Cauchy yang dinormalisasi dengan benar tetap Cauchy. Itu tidak konvergen ke Gaussian.

By the way, tidak hanya Gaussian tetapi banyak distribusi lainnya memiliki lonceng berbentuk PDF, misalnya Student t. Itu sebabnya deskripsi yang Anda kutip cukup liberal dan tidak tepat, mungkin dengan sengaja.


7

Berikut adalah ilustrasi jawaban kerub, histogram 1e5 diambil dari sarana sampel berskala (dengan ) distribusi-t dengan dua derajat kebebasan, sehingga variansnya tidak ada .n

Jika CLT berlaku, histogram untuk sebesar harus menyerupai kerapatan distribusi normal standar (yang, misalnya, memiliki kerapatan - pada puncaknya), yang ternyata tidak.nn=10001/2π0.4

masukkan deskripsi gambar di sini

library(MASS)
n <- 1000
samples.from.t <- replicate(1e5, sqrt(n)*mean(rt(n, df = 2)))
truehist(samples.from.t, xlim = c(-10,10), col="salmon")

3
Anda harus sedikit berhati-hati di sini seolah-olah Anda melakukan ini dengan distribusi- dengan mengatakan derajat kebebasan maka teorema Central Limit akan berlaku tetapi grafik Anda tidak akan memiliki kepadatan puncak sekitar tetapi sebaliknya sekitar karena varians aslinya tidak akan3 0,4 1t30.4116π0.231
Henry

Itu adalah poin yang baik, seseorang dapat menstandarkan mean dengan sd(x)mendapatkan sesuatu yang, jika CLT berfungsi, konvergen oleh teorema Slutzky, ke varian N (0,1). Saya ingin membuat contoh sederhana, tetapi Anda tentu saja benar.
Christoph Hanck

6

Kasus sederhana di mana CLT tidak dapat menampung karena alasan yang sangat praktis, adalah ketika urutan variabel acak mendekati batas probabilitasnya secara ketat dari satu sisi . Ini ditemui misalnya dalam estimator yang memperkirakan sesuatu yang terletak pada batas.

Contoh standar di sini mungkin adalah estimasi dalam sampel iid Uniforms . Estimasi kemungkinan maksimum akan menjadi statistik urutan maksimum, dan ia akan mendekati hanya dari bawah: berpikir naif, karena batas probabilitasnya adalah , estimator tidak dapat memiliki distribusi "sekitar" - dan CLT adalah pergiU ( 0 , θ ) θ θ θθU(0,θ)θθθ

Estimator yang diskalakan dengan benar memiliki distribusi terbatas - tetapi tidak dari "varietas CLT".


3

Anda dapat menemukan solusi cepat di sini.

Pengecualian untuk teorema batas pusat muncul

  1. Ketika ada beberapa maksima dengan tinggi yang sama, dan
  2. Di mana turunan kedua menghilang secara maksimal.

Ada beberapa pengecualian lain yang diuraikan dalam jawaban @chub.


Pertanyaan yang sama telah ditanyakan pada math.stackexchange . Anda dapat memeriksa jawabannya di sana.


5
Dengan "maxima", maksud Anda mode? Menjadi bimodal tidak ada hubungannya dengan gagal memuaskan CLT.
Akumulasi

@Accumulation: Kata-kata di sini membingungkan karena sebenarnya mengacu pada PGF dari rvM(z)=n=P(X=n)zn
Alex R.

@AlexR. Jawabannya tidak masuk akal sama sekali tanpa membaca tautan, dan jauh dari jelas bahkan dengan tautan. Saya condong ke arah downvoting sebagai lebih buruk daripada jawaban tautan saja.
Akumulasi
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.