Saya sedang membaca bab regresi berganda Analisis Data dan Grafik Menggunakan R: Sebuah Pendekatan Berbasis Contoh dan agak bingung untuk mengetahui bahwa itu merekomendasikan memeriksa hubungan linear antara variabel penjelas (menggunakan sebar scatter) dan, jika ada t apapun, mengubah mereka sehingga mereka jangan menjadi lebih terkait linear. Berikut beberapa kutipannya:
6.3 Strategi untuk memasang model regresi berganda
(...)
Periksa matriks sebar yang melibatkan semua variabel penjelas. (Termasuk variabel dependen adalah, pada titik ini, opsional. ) Cari dulu untuk bukti non-linearitas dalam plot variabel penjelas terhadap satu sama lain.
(...)
Poin ini mengidentifikasi strategi pencarian model - mencari model di mana hubungan regresi antara variabel penjelas mengikuti bentuk linear "sederhana" . Jadi, jika beberapa plot berpasangan menunjukkan bukti non-linearitas, pertimbangkan penggunaan transformasi untuk memberikan hubungan yang lebih linier . Meskipun belum tentu terbukti mungkin, mengikuti strategi ini, untuk memodelkan hubungan regresi secara memadai, ini adalah strategi yang baik, untuk alasan yang diberikan di bawah ini, untuk mengikuti dalam memulai pencarian.
(...)
Jika hubungan antara variabel penjelas mendekati linier, mungkin setelah transformasi, maka mungkin untuk menafsirkan plot variabel prediktor terhadap variabel respons dengan keyakinan.
(...)
Mungkin tidak mungkin untuk menemukan transformasi dari satu atau lebih variabel penjelas yang memastikan hubungan (berpasangan) yang ditunjukkan dalam panel tampak linier. Ini dapat menciptakan masalah baik untuk interpretasi plot diagnostik untuk setiap persamaan regresi pas dan untuk interpretasi koefisien dalam persamaan pas. Lihat Cook dan Weisberg (1999).
Tidakkah saya harus khawatir tentang hubungan linier antara variabel dependen (karena risiko multikolinieritas) daripada secara aktif mengejar mereka? Apa keuntungan memiliki variabel terkait linear?
Para penulis memang membahas masalah multikolinearitas nanti dalam bab ini, tetapi rekomendasi ini tampaknya bertentangan dengan menghindari multikolinearitas.