Pertanyaan ini merujuk pada makalah Galit Shmueli "Untuk Menjelaskan atau Memprediksi" .
Secara khusus, di bagian 1.5, "Penjelasan dan Prediksi Berbeda", Profesor Shmueli menulis:
Dalam pemodelan penjelas fokusnya adalah pada meminimalkan bias untuk mendapatkan representasi paling akurat dari teori yang mendasarinya.
Ini membingungkan saya setiap kali saya membaca koran. Dalam hal apa meminimalkan bias dalam estimasi memberikan representasi paling akurat dari teori yang mendasarinya?
Saya juga menyaksikan ceramah Profesor Shmueli di sini , disampaikan pada JMP Discovery Summit 2017, dan dia menyatakan:
... hal-hal yang seperti model susut, ansambel, Anda tidak akan pernah melihatnya. Karena model-model tersebut, dengan desain, memperkenalkan bias untuk mengurangi bias / varians keseluruhan. Itu sebabnya mereka tidak akan ada di sana, tidak masuk akal secara teoritis untuk melakukan itu. Mengapa Anda ingin model Anda bias secara sengaja?
Ini tidak benar-benar menjelaskan pertanyaan saya, hanya menyatakan kembali klaim yang tidak saya mengerti.
Jika teori memiliki banyak parameter, dan kami memiliki sedikit data untuk memperkirakannya, kesalahan estimasi akan didominasi oleh varians. Mengapa tidak tepat untuk menggunakan prosedur estimasi bias seperti regresi ridge (menghasilkan estimasi bias varian yang lebih rendah) dalam situasi ini?