Dalam pengaturan regresi linear multivariat klasik, kami memiliki model:
Y=Xβ+ϵ
di mana mewakili variabel independen, mewakili beberapa variabel respons, dan adalah istilah kebisingan Gaussian iid. Noise memiliki mean nol, dan dapat dikorelasikan antar variabel respon. Solusi kemungkinan maksimum untuk bobot setara dengan solusi kuadrat terkecil (terlepas dari korelasi kebisingan) [1] [2]:Y ϵXYϵ
β^=(XTX)−1XTY
Ini sama dengan menyelesaikan secara independen masalah regresi terpisah untuk setiap variabel respon. Ini dapat dilihat dari fakta bahwa kolom ke- dari (berisi bobot untuk variabel keluaran ke- ) dapat diperoleh dengan mengalikan oleh kolom ke- (berisi nilai-nilai variabel respons ke- ).ß i ( X T X ) - 1 X T i Y iiβ^i(XTX)−1XTiYi
Namun, regresi linier multivariat berbeda dari penyelesaian masalah regresi individu secara terpisah karena prosedur inferensi statistik memperhitungkan korelasi antara variabel-variabel respon berganda (misalnya lihat [2], [3], [4]). Misalnya, matriks kovarians noise muncul dalam distribusi sampel, statistik uji, dan perkiraan interval.
Perbedaan lain muncul jika kami mengizinkan masing-masing variabel respons untuk memiliki set kovariat sendiri:
Yi=Xiβi+ϵi
di mana mewakili variabel respons ke- , dan dan mewakili set kovariat dan istilah noise yang terkait. Seperti di atas, persyaratan noise dapat dikorelasikan antar variabel respon. Dalam pengaturan ini, ada estimator yang lebih efisien daripada kuadrat terkecil, dan tidak dapat direduksi untuk menyelesaikan masalah regresi terpisah untuk setiap variabel respon. Misalnya, lihat [1]. i X i ϵ iYiiXiϵi
Referensi
- Zellner (1962) . Metode yang efisien untuk memperkirakan regresi yang tampaknya tidak terkait dan tes untuk bias agregasi.
- Helwig (2017) . Regresi linier multivariat [Slide]
- Fox dan Weisberg (2011) . Model linier multivarian dalam R. [Lampiran untuk: R Pendamping untuk Regresi Terapan]
- Maitra (2013) . Model Regresi Linier Multivariat. [Slide]