Pertimbangkan kasus di mana variabel respons Anda adalah serangkaian 'keberhasilan' dan 'kegagalan' (juga direpresentasikan sebagai 'ya' dan 'nos', detik dan detik, dll.). Jika ini benar, maka tidak mungkin istilah kesalahan Anda didistribusikan secara normal . Sebaliknya, istilah kesalahan Anda adalah Bernoulli , menurut definisi. Dengan demikian, salah satu asumsi yang disinggung adalah dilanggar. Asumsi lain seperti itu adalah homoskedastisitas, tetapi ini akan dilanggar juga, karena varians adalah fungsi dari rata-rata. Jadi kita dapat melihat bahwa GLM (OLS) tidak pantas untuk kasus ini. 10
Perhatikan bahwa, untuk model regresi linier tipikal, apa yang Anda prediksi (yaitu, ) adalah , rata-rata distribusi normal bersyarat dari respons di tempat yang tepat di mana . Yang kita butuhkan dalam kasus ini adalah untuk memprediksi , probabilitas 'sukses' di tempat itu. Jadi kami menganggap distribusi respons kami sebagai Bernoulli, dan kami memperkirakan parameter yang mengontrol perilaku distribusi itu. Namun, ada satu komplikasi penting di sini. Secara khusus, akan ada beberapa nilai untuk bahwa, bersama dengan perkiraan Anda akan menghasilkan nilai prediksi (yaitu,y^iμiX=xiπ^iXβy^iπ^i) yang akan menjadi atau . Tapi ini tidak mungkin, karena rentang adalah . Jadi kita perlu mengubah parameter sehingga dapat berkisar , seperti halnya sisi kanan GLiM Anda. Karenanya, Anda memerlukan fungsi tautan . <0>1π(0, 1)π(−∞, ∞)
Pada titik ini, kami telah menetapkan distribusi respons (Bernoulli) dan fungsi tautan (mungkin transformasi logit ). Kami sudah memiliki bagian struktural dari model kami: . Jadi sekarang kita memiliki semua bagian model yang diperlukan. Ini sekarang adalah model linier umum, karena kami telah 'melonggarkan' asumsi tentang variabel respons dan kesalahan kami. Xβ
Untuk menjawab pertanyaan spesifik Anda secara lebih langsung, model linear umum melemaskan asumsi tentang dan dengan mengajukan distribusi respons (dalam keluarga eksponensial ) dan fungsi tautan yang memetakan parameter yang dipermasalahkan ke interval . YU(−∞, ∞)
Untuk lebih lanjut tentang topik ini, mungkin membantu Anda untuk membaca jawaban saya untuk pertanyaan ini: Perbedaan antara logit dan probit model .