Sekarang, saya mengerti bahwa ini tergantung pada distribusi dan normalitas dalam prediktor
transformasi log memang membuat data lebih seragam
Sebagai klaim umum, ini salah --- tetapi bahkan jika itu masalahnya, mengapa keseragaman menjadi penting?
Pertimbangkan, misalnya,
i) prediktor biner yang hanya mengambil nilai 1 dan 2. Mengambil log akan menjadikannya sebagai prediktor biner yang hanya mengambil nilai 0 dan log 2. Tidak benar-benar memengaruhi apa pun kecuali intersep dan penskalaan istilah yang melibatkan prediktor ini. Bahkan nilai p dari prediktor tidak akan berubah, seperti halnya nilai yang dipasang.
ii) mempertimbangkan prediktor condong ke kiri. Sekarang ambil log. Biasanya menjadi lebih condong ke kiri.
iii) data yang seragam menjadi condong ke kiri
(Meskipun demikian, sering kali perubahan tidak selalu ekstrem)
kurang terpengaruh oleh outlier
Sebagai klaim umum, ini salah. Pertimbangkan outlier rendah dalam suatu prediksi.
Saya berpikir tentang log mentransformasikan semua variabel kontinu saya yang tidak menarik
Ke ujung Apa? Jika awalnya hubungan itu linier, mereka tidak akan lagi.
Dan jika mereka sudah melengkung, melakukan ini secara otomatis mungkin membuat mereka lebih buruk (lebih melengkung), tidak lebih baik.
-
Mengambil catatan prediktor (baik yang menarik atau tidak) terkadang cocok, tetapi tidak selalu demikian.