Saya mencoba memprediksi variabel respons dalam regresi linier yang harus selalu positif (biaya per klik). Ini jumlah uang. Di adwords, Anda membayar google untuk klik pada iklan Anda, dan angka negatif berarti bahwa Google membayar Anda ketika orang mengklik: P
Prediktor adalah semua nilai kontinu. Rsquared dan RMSE layak jika dibandingkan dengan model lain, bahkan out-of-sample:
RMSE Rsquared
1.4141477 0.8207303
Saya tidak dapat mengubah prediksi, karena ini adalah uang, jadi bahkan faktor penyelamatan kecil dapat mengubah biaya secara signifikan.
Sejauh yang saya mengerti, untuk model regresi tidak ada yang istimewa tentang angka nol dan negatif, sehingga menemukan hyperplane regresi terbaik tidak peduli apakah output sebagian negatif.
Ini adalah upaya pertama, menggunakan semua variabel yang saya miliki. Jadi ada ruang untuk perbaikan.
Apakah ada cara untuk memberi tahu model bahwa output tidak boleh negatif?