Saat ini saya mengambil kelas regresi linier terapan pertama saya di tingkat pascasarjana, dan saya berjuang dengan transformasi variabel prediktor dalam regresi linier berganda. Teks yang saya gunakan, Kutner dkk "Model Statistik Terapan Linier" tampaknya tidak mencakup pertanyaan yang saya miliki. (Selain menyarankan bahwa ada metode Box-Cox untuk mengubah banyak prediktor).
Ketika dihadapkan dengan variabel respons dan beberapa variabel prediktor, kondisi apa yang berusaha dicapai oleh masing-masing variabel prediktor? Saya mengerti bahwa kita pada akhirnya mencari kekonstanan varians kesalahan dan kesalahan yang terdistribusi normal (setidaknya dalam teknik yang telah saya ajarkan sejauh ini). Saya telah banyak latihan kembali, di mana solusinya adalah, sebagai contoh y ~ x1 + (1/x2) + log(x3)
, di mana satu atau lebih prediktor diubah.
Saya memahami alasan di bawah regresi linier sederhana, karena mudah untuk melihat y ~ x1 dan diagnostik terkait (plot qq residual, residual vs y, residual vs x, dll) dan tes untuk melihat apakah y ~ log ( x1) lebih sesuai dengan asumsi kami.
Apakah ada tempat yang baik untuk mulai memahami kapan harus mengubah prediktor di hadapan banyak prediktor?
Terima kasih sebelumnya. Mat