Kekhawatiran Anda persis kekhawatiran yang mendasari banyak diskusi saat ini dalam sains tentang reproduksibilitas. Namun, keadaan sebenarnya sedikit lebih rumit dari yang Anda sarankan.
Pertama, mari kita tentukan beberapa terminologi. Pengujian signifikansi hipotesis nol dapat dipahami sebagai masalah deteksi sinyal - hipotesis nol adalah benar atau salah, dan Anda dapat memilih untuk menolak atau mempertahankannya. Kombinasi dua keputusan dan dua kemungkinan keadaan "benar" menghasilkan tabel berikut ini, yang sebagian besar orang lihat di beberapa titik ketika mereka pertama kali belajar statistik:
Ilmuwan yang menggunakan pengujian signifikansi hipotesis nol berusaha untuk memaksimalkan jumlah keputusan yang benar (ditunjukkan dengan warna biru) dan meminimalkan jumlah keputusan yang salah (ditunjukkan dalam warna merah). Para ilmuwan yang bekerja juga mencoba untuk mempublikasikan hasil mereka sehingga mereka bisa mendapatkan pekerjaan dan memajukan karier mereka.
Tentu saja, ingatlah bahwa, seperti banyak penjawab lain telah sebutkan, hipotesis nol tidak dipilih secara acak - sebagai gantinya, biasanya dipilih secara khusus karena, berdasarkan teori sebelumnya, ilmuwan percaya itu salah . Sayangnya, sulit untuk mengukur proporsi kali bahwa para ilmuwan benar dalam prediksi mereka, tetapi ingatlah bahwa, ketika para ilmuwan berurusan dengan kolom " is false", mereka harus khawatir tentang negatif palsu daripada positif positif palsu.H0
H0
Bias publikasi
α
p
Tingkat kebebasan peneliti
αα. Mengingat adanya sejumlah besar praktik penelitian yang dipertanyakan, tingkat positif palsu dapat setinggi 0,60 bahkan jika tingkat nominal ditetapkan pada 0,05 ( Simmons, Nelson, & Simonsohn, 2011 ).
Penting untuk dicatat bahwa penggunaan derajat kebebasan peneliti yang tidak tepat (yang kadang-kadang dikenal sebagai praktik penelitian yang dipertanyakan; Martinson, Anderson, & de Vries, 2005 ) tidak sama dengan membuat data. Dalam beberapa kasus, mengecualikan pencilan adalah hal yang benar untuk dilakukan, baik karena peralatan gagal atau karena alasan lain. Masalah utama adalah bahwa, di hadapan derajat kebebasan peneliti, keputusan yang diambil selama analisis sering bergantung pada bagaimana data berubah ( Gelman & Loken, 2014), bahkan jika para peneliti yang bersangkutan tidak mengetahui fakta ini. Selama peneliti menggunakan derajat kebebasan peneliti (secara sadar atau tidak sadar) untuk meningkatkan probabilitas hasil yang signifikan (mungkin karena hasil yang signifikan lebih "dapat dipublikasi"), keberadaan derajat kebebasan peneliti akan kelebihan populasi literatur penelitian dengan positif palsu di cara yang sama seperti bias publikasi.
Peringatan penting untuk diskusi di atas adalah bahwa makalah ilmiah (setidaknya dalam psikologi, yang merupakan bidang saya) jarang terdiri dari hasil tunggal. Yang lebih umum adalah beberapa penelitian, yang masing-masing melibatkan beberapa tes - penekanannya adalah pada membangun argumen yang lebih besar dan mengesampingkan penjelasan alternatif untuk bukti yang disajikan. Namun, presentasi hasil selektif (atau adanya derajat kebebasan peneliti) dapat menghasilkan bias dalam serangkaian hasil semudah hasil tunggal. Ada bukti bahwa hasil yang disajikan dalam makalah multi-studi sering jauh lebih bersih dan lebih kuat daripada yang diharapkan bahkan jika semua prediksi studi ini semuanya benar ( Francis, 2013 ).
Kesimpulan
Pada dasarnya, saya setuju dengan intuisi Anda bahwa pengujian signifikansi nol hipotesis bisa salah. Namun, saya berpendapat bahwa pelaku sebenarnya yang menghasilkan tingkat positif palsu yang tinggi adalah proses seperti bias publikasi dan adanya derajat kebebasan peneliti. Memang, banyak ilmuwan sangat menyadari masalah ini, dan meningkatkan kemampuan reproduksi ilmiah adalah topik diskusi yang sangat aktif saat ini (misalnya, Nosek & Bar-Anan, 2012 ; Nosek, Spies, & Motyl, 2012 ). Jadi Anda berada di perusahaan yang baik dengan kekhawatiran Anda, tetapi saya juga berpikir ada juga alasan untuk optimisme hati-hati.
Referensi
Stern, JM, & Simes, RJ (1997). Bias publikasi: Bukti keterlambatan publikasi dalam studi kohort proyek penelitian klinis. BMJ, 315 (7109), 640–645. http://doi.org/10.1136/bmj.315.7109.640
Dwan, K., Altman, DG, Arnaiz, JA, Bloom, J., Chan, A., Cronin, E., ... Williamson, PR (2008). Tinjauan sistematis dari bukti empiris bias publikasi penelitian dan bias pelaporan hasil. PLoS ONE, 3 (8), e3081. http://doi.org/10.1371/journal.pone.0003081
Rosenthal, R. (1979). Masalah laci file dan toleransi untuk hasil nol. Buletin Psikologis, 86 (3), 638-641. http://doi.org/10.1037/0033-2909.86.3.638
Simmons, JP, Nelson, LD, & Simonsohn, U. (2011). Psikologi positif-palsu: Fleksibilitas yang tidak diungkapkan dalam pengumpulan dan analisis data memungkinkan penyajian yang penting. Ilmu Psikologi, 22 (11), 1359–1366. http://doi.org/10.1177/0956797611417632
Martinson, BC, Anderson, MS, & de Vries, R. (2005). Ilmuwan berperilaku buruk. Alam, 435, 737-738. http://doi.org/10.1038/435737a
Gelman, A., & Loken, E. (2014). Krisis statistik dalam sains. American Scientist, 102, 460-465.
Francis, G. (2013). Replikasi, konsistensi statistik, dan bias publikasi. Jurnal Psikologi Matematika, 57 (5), 153–169. http://doi.org/10.1016/j.jmp.2013.02.003
Nosek, BA, & Bar-Anan, Y. (2012). Utopia ilmiah: I. Membuka komunikasi ilmiah. Penyelidikan Psikologis, 23 (3), 217–243. http://doi.org/10.1080/1047840X.2012.692215
Nosek, BA, Spies, JR, & Motyl, M. (2012). Utopia ilmiah: II. Restrukturisasi insentif dan praktik untuk mempromosikan kebenaran daripada publikasi. Perspektif tentang Ilmu Psikologis, 7 (6), 615-631. http://doi.org/10.1177/1745691612459058