Setidaknya bagi saya, asumsi normalitas muncul dari dua (sangat kuat) alasan:
Teorema Batas Pusat.
Distribusi Gaussian adalah distribusi maksimum entropi (berkenaan dengan versi berkelanjutan dari entropi Shannon).
Saya pikir Anda menyadari poin pertama: jika sampel Anda adalah jumlah dari banyak proses, maka selama beberapa kondisi ringan terpenuhi, distribusinya cukup banyak gaussian (ada generalisasi dari CLT di mana Anda sebenarnya tidak harus mengasumsikan bahwa rv dari jumlah didistribusikan secara identik, lihat, misalnya, Lyapunov CLT).
Poin kedua adalah yang bagi sebagian orang (khususnya fisikawan) lebih masuk akal: mengingat momen pertama dan kedua dari suatu distribusi, distribusi yang dianggap kurang informasi (yaitu yang paling konservatif) berkenaan dengan ukuran entropi Shannon yang berkelanjutan (yang merupakan agak sewenang-wenang pada kasus berkelanjutan, tetapi, setidaknya bagi saya, benar-benar objektif dalam kasus diskrit, tapi itu cerita lain), adalah distribusi gaussian. Ini adalah bentuk dari apa yang disebut "prinsip entropi maksimum", yang tidak begitu tersebar luas karena penggunaan sebenarnya dari bentuk entropi agak sewenang-wenang (lihat artikel Wikipedia ini untuk informasi lebih lanjut tentang ukuran ini ).
μ⃗ Σ
PD: Saya harus menambahkan prinsip entropi maksimum bahwa, menurut makalah ini , jika Anda mengetahui kisaran variasi variabel Anda, Anda harus membuat penyesuaian pada distribusi yang Anda dapatkan dengan prinsip entropi maksimum.