Kebingungan terkait normalisasi data


9

Saya mencoba mempelajari model regresi linier. Namun, saya memiliki beberapa kebingungan terkait dengan normalisasi data. Saya telah menormalkan fitur / prediktor menjadi nol mean dan varian unit. Apakah saya perlu melakukan hal yang sama untuk target. Jika demikian mengapa?


1
Mengapa Anda menormalkan fitur / prediksi?
Peter Flom

4
BTW saya pikir 'standardisasi' adalah istilah yang lebih baik untuk itu.
Scortchi

Jawaban:


6

Normalisasi target dalam regresi linier tidak masalah. Dalam regresi linier, kecocokan Anda akan berbentuk Ketika Anda prediktor terpusat, suku konstanta akan selalu menjadi rata-rata . Jadi jika Anda memusatkan sebelum menjalankan regresi, Anda hanya akan mendapatkan , tetapi semua koefisien Anda lainnya akan tetap tidak berubah.xia0yiyia0=0

y^i=a0+axi.
xia0yiyia0=0

(Yang dikatakan, menormalkan prediktor --- seperti yang sedang Anda lakukan --- adalah ide yang baik.)


1
Mengapa menormalisasi prediksi merupakan ide yang bagus?
Scortchi

a0

2
@Scortchi Normalisasi prediktor tidak perlu, tetapi dapat membuat menafsirkan koefisien dari regresi lebih mudah: Setelah normalisasi, koefisien besar sesuai dengan prediktor penting. Juga, tanpa normalisasi, koefisien istilah interaksi dapat sangat menyesatkan. Karena itu, normalisasi tidak akan memengaruhi prediksi yang Anda dapatkan dari model Anda, jadi normalisasi hanya penting jika Anda bermaksud menafsirkan koefisien dalam regresi.
Stefan Taruhan

1
@ user34790 Matematika dikerjakan di pmean.com/10/10/LeastSquares.html
Stefan Wager

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.