Saya memahami konsep penskalaan matriks data untuk digunakan dalam model regresi linier. Misalnya, dalam R Anda dapat menggunakan:
scaled.data <- scale(data, scale=TRUE)
Satu-satunya pertanyaan saya adalah, untuk pengamatan baru yang ingin saya prediksi nilai outputnya, bagaimana mereka diskalakan dengan benar? Apakah itu , scaled.new <- (new - mean(data)) / std(data)
?
y = y_esc * sd(y) + mean(y)
, tapi itu akan mengacaukan properti model saya kira, jadi saya juga menunggu jawaban yang lebih teknis juga!