Sebagai asumsi regresi linier, normalitas distribusi kesalahan kadang-kadang salah "diperluas" atau ditafsirkan sebagai kebutuhan untuk normalitas y atau x.
Apakah mungkin untuk membuat skenario / dataset bahwa di mana X dan Y adalah tidak normal tetapi istilah kesalahannya adalah dan oleh karena itu estimasi regresi linier yang diperoleh valid?
5
Contoh sepele: X memiliki distribusi Bernoulli (yaitu, mengambil nilai 0 atau 1); Y = X + N (0, 0,1). Baik X maupun Y biasanya tidak terdistribusi sendiri, tetapi regresi Y pada X masih berfungsi.
—
Hong Ooi
Saya kira Anda berpikir tentang distribusi residu, bukan distribusi variabel.
—
tashuhka
Saya punya contoh yang berhasil di sini: Bagaimana jika residu terdistribusi normal tetapi Y tidak?
—
gung - Reinstate Monica