Salah satu metode naif untuk mendekati distribusi normal adalah dengan menambahkan bersama-sama mungkin variabel acak IID yang terdistribusi secara seragam pada , kemudian masuk kembali dan skala, bergantung pada Teorema Batas Pusat. ( Catatan : Ada metode yang lebih akurat seperti transformasi Box-Muller .) Jumlah variabel acak IID dikenal sebagai distribusi jumlah seragam atau distribusi Irwin-Hall .[ 0 , 1 ]
Berapa besar kesalahan dalam memperkirakan distribusi jumlah seragam dengan distribusi normal?
Kapan pun jenis pertanyaan ini muncul untuk mendekati jumlah variabel acak IID, orang-orang (termasuk saya) memunculkan Teorema Berry – Esseen , yang merupakan versi efektif dari Teorema Batas Pusat mengingat bahwa momen ketiga ada:
di mana adalah fungsi distribusi kumulatif untuk jumlah yang dihitung kembali dari variabel acak IID, adalah momen sentral ketiga mutlak, adalah standar deviasi, dan adalah konstanta absolut yang dapat dianggap 1 atau bahkan 1/2 . n ρ E | ( X - E X ) 3 | σ C 1 1 / 2
Ini tidak memuaskan. Tampak bagi saya bahwa perkiraan Berry-Esseen paling dekat dengan tajam pada distribusi binomial yang terpisah, dengan kesalahan terbesar pada untuk distribusi binomial simetris. Kesalahan terbesar terjadi pada lompatan terbesar. Namun, distribusi jumlah seragam tidak memiliki lompatan.
Tes numerik menunjukkan bahwa kesalahan menyusut lebih cepat daripada .
Menggunakan , estimasi Berry – Esseen adalah
yang untuk sekitar , , dan , masing-masing. Perbedaan maksimum sebenarnya untuk tampaknya masing-masing sekitar , , dan , yang jauh lebih kecil dan tampaknya jatuh sebagai bukannya .