Biarkan saya mulai dengan menyangkal premis. Robert Geary mungkin tidak melebih-lebihkan kasus ketika dia berkata (pada 1947) " ... normalitas adalah mitos; tidak pernah ada, dan tidak akan pernah ada, distribusi normal. " -
distribusi normal adalah model *, sebuah pendekatan yang terkadang lebih atau kurang bermanfaat.
* (tentang hal itu, lihat George Box , meskipun saya lebih suka versi di profil saya).
Bahwa beberapa fenomena mendekati normal mungkin bukan kejutan besar, karena jumlah efek independen [atau bahkan tidak terlalu berkorelasi kuat] harus, jika ada banyak dari mereka dan tidak ada yang memiliki varian yang substansial dibandingkan dengan varian dari Jumlah sisanya yang mungkin kita lihat distribusi cenderung terlihat lebih normal.
Teorema batas pusat (yaitu tentang konvergensi ke distribusi normal dari sampel standar berarti sebagai n menuju tak terhingga dalam beberapa kondisi ringan) setidaknya menunjukkan bahwa kita mungkin melihat kecenderungan menuju normalitas itu dengan ukuran sampel yang cukup besar tetapi terbatas.
Tentu saja jika cara standar sekitar normal, jumlah standar akan; ini adalah alasan untuk alasan "jumlah banyak efek". Jadi, jika ada banyak kontribusi kecil untuk variasi, dan mereka tidak sangat berkorelasi, Anda mungkin cenderung melihatnya.
Teorema Berry-Esseen memberi kita pernyataan tentang hal itu (konvergensi menuju distribusi normal) benar-benar terjadi dengan sarana sampel standar untuk data iid (di bawah kondisi yang sedikit lebih ketat daripada CLT, karena mengharuskan momen absolut ketiga terbatas), karena serta memberi tahu kami tentang seberapa cepat itu terjadi. Versi berikutnya dari teorema ini berhubungan dengan komponen-komponen yang tidak terdistribusi secara identik dalam penjumlahan , meskipun batas atas pada penyimpangan dari normalitas kurang ketat.
Kurang formal, perilaku konvolusi dengan distribusi yang cukup bagus memberi kita tambahan (meskipun terkait erat) alasan untuk mencurigai itu mungkin cenderung menjadi perkiraan yang adil dalam sampel terbatas dalam banyak kasus. Konvolusi bertindak sebagai semacam operator "mengolesi" yang orang-orang yang menggunakan estimasi kepadatan kernel di berbagai kernel akan terbiasa dengan; setelah Anda membuat standar hasilnya (sehingga varians tetap konstan setiap kali Anda melakukan operasi seperti itu), jelas ada perkembangan menuju bentuk bukit yang semakin simetris saat Anda berulang kali menghaluskan (dan tidak masalah jika Anda mengganti kernel setiap kali).
Terry Tao memberikan beberapa diskusi yang bagus tentang versi teorema limit Tengah dan teorema Berry-Esseen sini , dan di sepanjang jalan menyebutkan pendekatan ke versi Berry-Esseen yang tidak independen.
Jadi ada setidaknya satu kelas situasi di mana kita mungkin berharap melihatnya, dan alasan formal untuk berpikir itu akan cenderung terjadi dalam situasi itu. Namun, paling banter bahwa hasil dari "jumlah banyak efek" akan normal adalah perkiraan. Dalam banyak kasus ini adalah perkiraan yang cukup masuk akal (dan dalam kasus-kasus tambahan meskipun perkiraan distribusi tidak dekat, beberapa prosedur yang menganggap normalitas tidak terlalu sensitif terhadap distribusi nilai-nilai individual, setidaknya dalam sampel besar).
Ada banyak keadaan lain di mana efek tidak "menambah" dan di sana kita dapat mengharapkan hal-hal lain terjadi; misalnya, dalam banyak data keuangan, efek cenderung bersifat multiplikasi (efek akan memindahkan jumlah dalam persentase, seperti bunga dan inflasi dan nilai tukar misalnya). Di sana kita tidak mengharapkan normalitas, tetapi terkadang kita mungkin mengamati perkiraan kasar terhadap normalitas pada skala log. Dalam situasi lain tidak ada yang cocok, bahkan dalam arti kasar. Misalnya, waktu antar-peristiwa umumnya tidak akan didekati dengan baik oleh normalitas atau normalitas log; tidak ada "jumlah" atau "produk" dari efek untuk diperdebatkan di sini. Ada banyak fenomena lain yang bisa kita bahas untuk "hukum" tertentu dalam keadaan tertentu.