Saat mentransformasikan variabel, apakah Anda harus menggunakan semua transformasi yang sama? Misalnya, dapatkah saya memilih dan memilih variabel yang diubah secara berbeda, seperti pada:
Biarkan, menjadi usia, lama bekerja, lama tinggal, dan penghasilan.
Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3)
Atau, haruskah Anda konsisten dengan transformasi Anda dan menggunakan semua yang sama? Seperti dalam:
Y = B1*log(x1) + B2*log(x2) + B3*log(x3)
Pemahaman saya adalah bahwa tujuan transformasi adalah untuk mengatasi masalah normalitas. Melihat histogram dari masing-masing variabel kita dapat melihat bahwa mereka menyajikan distribusi yang sangat berbeda, yang akan membuat saya percaya bahwa transformasi yang diperlukan berbeda pada variabel dengan basis variabel.
## R Code
df <- read.spss(file="http://www.bertelsen.ca/R/logistic-regression.sav",
use.value.labels=T, to.data.frame=T)
hist(df[1:7])
Terakhir, seberapa validkah untuk mentransformasikan variabel menggunakan mana memiliki nilai ? Apakah transformasi ini perlu konsisten di semua variabel atau apakah itu digunakan adhoc bahkan untuk variabel yang tidak termasuk 's?
## R Code
plot(df[1:7])