Saya telah mengambil kursus pembelajaran mesin di kampus saya. Di salah satu quize, pertanyaan ini diajukan.
Model 1:
Model 2:Manakah dari model di atas yang lebih cocok dengan data? (anggap data dapat dimodelkan menggunakan regresi linier)
Jawaban yang benar (menurut profesor) adalah bahwa kedua model akan tampil sama baiknya. Namun saya percaya bahwa model pertama akan lebih cocok.
Inilah alasan di balik jawaban saya. Model kedua, yang dapat ditulis ulang sebagai , tidak akan sama dengan model pertama. sebenarnya adalah parabola, dan karenanya memiliki nilai minimum ( dalam kasus ini). Sekarang karena ini, kisaran dalam model pertama lebih besar dari kisaran dalam model kedua. Oleh karena itu, jika data sedemikian rupa sehingga kecocokan terbaik memiliki kemiringan kurang dari , model kedua akan berkinerja sangat buruk dibandingkan dengan yang pertama. Namun dalam kasus kemiringan paling cocok lebih besar dari , kedua model akan memiliki kinerja yang sama baiknya.
Jadi apakah yang pertama lebih baik, atau keduanya sama persis?