Dalam konteks ilmu sosial tempat saya berasal, masalahnya adalah apakah Anda tertarik pada (a) prediksi atau (b) menguji pertanyaan penelitian yang terfokus. Jika tujuannya adalah prediksi maka pendekatan yang didorong data sesuai. Jika tujuannya adalah untuk menguji pertanyaan penelitian yang terfokus, maka penting untuk mempertimbangkan model regresi mana yang secara khusus menguji pertanyaan Anda.
Misalnya, jika tugas Anda adalah memilih serangkaian tes seleksi untuk memprediksi kinerja pekerjaan, tujuannya dapat dianggap sebagai salah satu upaya memaksimalkan prediksi kinerja pekerjaan. Dengan demikian, pendekatan berbasis data akan bermanfaat.
Sebaliknya jika Anda ingin memahami peran relatif dari variabel kepribadian dan variabel kemampuan dalam mempengaruhi kinerja, maka pendekatan perbandingan model tertentu mungkin lebih tepat.
Biasanya ketika mengeksplorasi pertanyaan penelitian yang difokuskan, tujuannya adalah untuk menjelaskan sesuatu tentang proses kausal yang mendasarinya yang beroperasi sebagai lawan mengembangkan model dengan prediksi yang optimal.
Ketika saya sedang dalam proses mengembangkan model tentang proses berdasarkan data cross-sectional saya akan waspada tentang: (a) termasuk prediktor yang secara teoritis dapat dianggap sebagai konsekuensi dari variabel hasil. Misalnya, kepercayaan seseorang bahwa mereka adalah orang yang berkinerja baik adalah prediktor yang baik untuk kinerja pekerjaan, tetapi kemungkinan hal ini setidaknya sebagian disebabkan oleh fakta bahwa mereka telah mengamati kinerja mereka sendiri. (B) termasuk sejumlah besar prediktor yang semuanya mencerminkan fenomena mendasar yang sama. Misalnya, termasuk 20 item yang semuanya mengukur kepuasan dengan kehidupan dengan cara yang berbeda.
Dengan demikian, pertanyaan penelitian terfokus lebih bergantung pada pengetahuan khusus domain. Ini mungkin bisa menjelaskan mengapa pendekatan berbasis data lebih jarang digunakan dalam ilmu sosial.