Lagi pula, jika sebuah makalah telah menghabiskan waktu bertahun-tahun untuk menulis dan telah melalui tinjauan sejawat yang teliti, maka tentu saja statistiknya akan solid?
Pengalaman saya membaca makalah yang berupaya menerapkan statistik di berbagai bidang (ilmu politik, ekonomi, psikologi, kedokteran, biologi, keuangan, ilmu aktuaria, akuntansi, optik, astronomi, dan banyak lainnya) adalah kualitas dari analisis statistik dapat berada di mana saja pada spektrum dari sangat baik dan dilakukan dengan baik untuk omong kosong mengerikan. Saya telah melihat analisis yang baik di setiap bidang yang telah saya sebutkan, dan analisis yang dilakukan dengan buruk di hampir semua bidang tersebut.
Beberapa jurnal umumnya cukup bagus, dan beberapa bisa lebih seperti bermain anak panah dengan penutup mata - Anda mungkin mendapatkan sebagian besar dari mereka tidak terlalu jauh dari target, tetapi akan ada beberapa di dinding, lantai dan langit-langit. Dan mungkin kucing itu.
Saya tidak berencana menyebutkan nama pelakunya, tetapi saya akan mengatakan bahwa saya telah melihat karier akademik dibangun berdasarkan kesalahan penggunaan statistik (yaitu ketika kesalahan dan kesalahpahaman yang sama diulang dalam kertas setelah kertas, lebih dari satu dekade).
Jadi saran saya adalah biarkan pembaca berhati - hatilah ; jangan percaya bahwa editor dan peer reviewer tahu apa yang mereka lakukan. Seiring berjalannya waktu, Anda mungkin mengetahui yang mana penulis umumnya dapat diandalkan untuk tidak melakukan sesuatu yang terlalu mengejutkan, dan mana yang harus diperlakukan secara hati-hati. Anda mungkin merasa bahwa beberapa jurnal biasanya memiliki standar yang sangat tinggi untuk statistik mereka.
Tetapi bahkan seorang penulis yang baik biasanya dapat membuat kesalahan, atau wasit dan editor dapat gagal untuk mengambil kesalahan yang biasanya mereka temukan; jurnal yang biasanya bagus dapat mempublikasikan howler.
[Kadang-kadang, Anda bahkan akan melihat surat kabar yang sangat buruk memenangkan hadiah atau penghargaan ... yang tidak banyak berpengaruh pada kualitas orang yang menilai hadiah itu.]
Saya tidak ingin menebak apa fraksi statistik "buruk" yang mungkin saya lihat (dalam berbagai samaran, dan pada setiap tahap dari mendefinisikan pertanyaan, desain penelitian, pengumpulan data, manajemen data, ... sampai ke analisis dan kesimpulan), tetapi itu tidak cukup kecil bagi saya untuk merasa nyaman.
Saya bisa menunjukkan contoh, tapi saya pikir ini bukan forum yang tepat untuk melakukan itu. (Akan lebih baik jika ada adalah forum yang baik untuk itu, sebenarnya, tapi sekali lagi, itu mungkin akan menjadi sangat "dipolitisir" cukup cepat, dan segera gagal untuk melayani tujuannya.)
Saya telah menghabiskan beberapa waktu menjelajahi PLOS ONE ... dan sekali lagi, tidak akan menunjukkan makalah tertentu. Beberapa hal yang saya perhatikan: sepertinya sebagian besar makalah memiliki statistik di dalamnya, mungkin lebih dari setengahnya memiliki tes hipotesis. Bahaya utama tampaknya banyak tes, baik dengan tinggi seperti 0,05 pada masing-masing (yang tidak secara otomatis masalah selama kita mengerti bahwa beberapa efek yang sangat kecil mungkin muncul sebagai signifikan secara kebetulan), atau sangat rendah tingkat signifikansi individual, yang akan cenderung memberikan daya rendah. Saya juga melihat sejumlah kasus di mana sekitar setengah lusin tes berbedaαrupanya diterapkan untuk menyelesaikan pertanyaan yang persis sama. Ini mengejutkan saya sebagai ide yang umumnya buruk. Secara keseluruhan standarnya cukup bagus di beberapa lusin kertas, tetapi di masa lalu saya telah melihat kertas yang benar-benar mengerikan di sana.
[Mungkin saya bisa menikmati hanya satu contoh, secara tidak langsung. Pertanyaan ini menanyakan tentang seseorang yang melakukan sesuatu yang sangat meragukan. Itu jauh dari hal terburuk yang pernah kulihat.]
Di sisi lain, saya juga melihat (bahkan lebih sering) kasus-kasus di mana orang dipaksa untuk melewati semua jenis simpai yang tidak perlu untuk mendapatkan analisis mereka diterima; hal-hal yang masuk akal untuk dilakukan tidak diterima karena ada cara yang "benar" untuk melakukan hal-hal menurut peninjau atau editor atau penyelia, atau hanya dalam budaya yang tidak diucapkan dalam bidang tertentu.