Intinya , semakin banyak saya belajar tentang statistik, semakin sedikit saya percaya makalah yang diterbitkan di bidang saya; Saya hanya percaya bahwa para peneliti tidak melakukan statistik mereka dengan cukup baik.
Saya seorang awam, untuk berbicara. Saya dilatih dalam biologi tetapi saya tidak memiliki pendidikan formal dalam statistik atau matematika. Saya menikmati R dan sering berusaha membaca (dan memahami ...) beberapa dasar teori dari metode yang saya terapkan ketika melakukan penelitian. Tidak akan mengejutkan saya jika mayoritas orang yang melakukan analisis hari ini sebenarnya tidak terlatih secara formal. Saya telah menerbitkan sekitar 20 makalah asli, beberapa di antaranya telah diterima oleh jurnal dan ahli statistik yang diakui sering terlibat dalam proses peninjauan. Analisis saya umumnya mencakup analisis survival, regresi linier, regresi logistik, model campuran. Tidak pernah ada pengulas bertanya tentang asumsi model, kecocokan atau evaluasi.
Jadi, saya tidak pernah terlalu peduli tentang asumsi model, kecocokan, dan evaluasi. Saya mulai dengan sebuah hipotesis, menjalankan regresi dan kemudian mempresentasikan hasilnya. Dalam beberapa kasus saya berusaha mengevaluasi hal-hal ini, tetapi saya selalu berakhir dengan " baik itu tidak memenuhi semua asumsi, tapi saya percaya hasilnya (" pengetahuan materi pelajaran ") dan mereka masuk akal, jadi tidak apa-apa " dan ketika berkonsultasi dengan ahli statistik, mereka sepertinya selalu setuju.
Sekarang, saya sudah bicara dengan ahli statistik dan non-ahli statistik lain (ahli kimia, dokter, dan ahli biologi) yang melakukan analisis sendiri; tampaknya orang tidak terlalu peduli tentang semua asumsi dan evaluasi formal ini. Tetapi di sini, di CV, ada banyak orang yang bertanya tentang residu, model fit, cara untuk mengevaluasinya, nilai eigen, vektor dan daftarnya terus berlanjut. Biarkan saya begini, ketika lme4 memperingatkan tentang nilai eigen besar, saya benar-benar ragu bahwa banyak penggunanya peduli untuk mengatasinya ...
Apakah ini sepadan dengan usaha ekstra? Apakah tidak mungkin bahwa sebagian besar dari semua hasil yang dipublikasikan tidak menghargai asumsi-asumsi ini dan mungkin bahkan belum menilai mereka? Ini mungkin masalah yang berkembang karena basis data tumbuh lebih besar setiap hari dan ada anggapan bahwa semakin besar data, semakin tidak penting asumsi dan evaluasi.
Saya bisa saja benar-benar salah, tetapi ini adalah bagaimana saya merasakan ini.
Pembaruan: Kutipan yang dipinjam dari StasK (di bawah): http://www.nature.com/news/science-joins-push-to-screen-statistics-in-papers-1.15509