Dalam beberapa tahun terakhir, berbagai cendekiawan telah mengangkat masalah pengujian hipotesis ilmiah yang merugikan, dijuluki "derajat kebebasan peneliti," yang berarti bahwa para ilmuwan memiliki banyak pilihan untuk membuat selama analisis mereka yang bias terhadap penemuan dengan nilai p <5%. Pilihan ambigu ini, misalnya, kasus mana yang akan dimasukkan, kasus mana yang dikategorikan sebagai pencilan, menjalankan banyak spesifikasi model hingga sesuatu muncul, jangan mempublikasikan hasil nol, dll. (Makalah yang memicu debat psikologi ini ada di sini , lihat artikel Slate yang populer dan debat lanjutan oleh Andrew Gelman di sini , dan majalah Time juga menyentuh topik ini di sini .)
Pertama , satu pertanyaan klarifikasi:
The Waktu majalah menulis,
"Kekuatan 0,8 berarti bahwa dari sepuluh hipotesis sejati yang diuji, hanya dua yang akan dikesampingkan karena efeknya tidak diambil dalam data;"
Saya tidak yakin bagaimana ini cocok dengan definisi fungsi daya yang saya temukan di buku teks, yang merupakan probabilitas menolak nol sebagai fungsi dari parameter . Dengan berbeda, kami memiliki kekuatan yang berbeda, jadi saya tidak mengerti kutipan di atas.
Kedua , beberapa implikasi penelitian:
Di bidang ilmu / ekonomi politik saya, para sarjana hanya menggunakan semua data negara-tahun yang tersedia. Jadi, haruskah kita tidak khawatir dengan sampel biola di sini?
Dapatkah masalah menjalankan beberapa tes tetapi melaporkan hanya satu model diperbaiki hanya dengan fakta bahwa orang lain dalam disiplin akan menguji ulang kertas Anda dan segera menjatuhkan Anda karena tidak memiliki hasil yang kuat? Mengantisipasi hal ini, para sarjana di bidang saya lebih cenderung memasukkan
robustness check
bagian, di mana mereka menunjukkan bahwa beberapa spesifikasi model tidak mengubah hasilnya. Apakah ini cukup?Andrew Gelman dan yang lainnya mengangkat poin bahwa tidak masalah data, akan selalu mungkin untuk menemukan dan menerbitkan beberapa "pola" yang tidak benar-benar ada. Tetapi ini seharusnya tidak menjadi perhatian, mengingat fakta bahwa "pola" empiris apa pun harus didukung oleh sebuah teori, dan teori-teori saingan dalam suatu disiplin hanya akan terlibat dalam debat / ras untuk menemukan kubu mana yang mampu menemukan lebih banyak "pola" di berbagai tempat. Jika suatu pola benar-benar palsu, maka teori di baliknya akan dengan cepat dihancurkan ketika tidak ada pola yang serupa dalam sampel / pengaturan lain. Bukankah ini bagaimana ilmu pengetahuan berkembang?
Dengan asumsi bahwa tren jurnal saat ini untuk hasil nol benar-benar akan berkembang, apakah ada cara bagi kita untuk mengumpulkan semua hasil nol dan positif bersama-sama dan membuat kesimpulan pada teori bahwa mereka semua mencoba menguji?