Apa pentingnya perbedaan antara model linear dan non-linear? Pertanyaannya Nonlinear vs generalised model: Bagaimana Anda merujuk pada regresi logistik, Poisson, dll.? dan jawabannya adalah klarifikasi yang sangat membantu tentang linearitas / non-linearitas model linier umum. Tampaknya sangat penting untuk membedakan model linear dari model non-linear, tetapi tidak jelas bagi saya mengapa? Misalnya, pertimbangkan model regresi ini:
Kedua Model 1 dan 2 adalah linier, dan solusi untuk ada dalam bentuk tertutup, mudah ditemukan menggunakan penduga OLS standar. Tidak demikian untuk Model 3 dan 4, yang nonlinier karena (beberapa) turunan dari E [Y \ mid X] wrt \ beta masih berfungsi \ beta .E [ Y ∣ X ] β β
Salah satu solusi sederhana untuk memperkirakan dalam Model 3 adalah dengan membuat linierisasi model dengan menetapkan , perkirakan menggunakan model linier, dan kemudian hitung .
Untuk memperkirakan parameter dalam Model 4, kita dapat mengasumsikan mengikuti distribusi binomial (anggota keluarga eksponensial), dan, menggunakan fakta bahwa bentuk logistik model adalah tautan kanonik, linierisasi rhs model. Ini adalah kontribusi mani Nelder dan Wedderburn .
Tetapi mengapa non-linearitas ini menjadi masalah? Mengapa seseorang tidak bisa hanya menggunakan beberapa algoritma iteratif untuk menyelesaikan Model 3 tanpa linierisasi menggunakan fungsi akar kuadrat, atau Model 4 tanpa menggunakan GLM. Saya curiga bahwa sebelum kekuatan komputasi meluas, ahli statistik berusaha untuk meluruskan segalanya. Jika benar, maka mungkin "masalah" yang diperkenalkan oleh nonlinier adalah sisa dari masa lalu? Apakah komplikasi yang diperkenalkan oleh model non-linear hanyalah komputasi, atau adakah masalah teoritis lain yang membuat model non-linier lebih menantang untuk disesuaikan dengan data daripada model linier?