Saya telah berdiskusi dengan ahli statistik pada tahun 2009 di mana dia menyatakan bahwa nilai pasti dari nilai-p tidak relevan: satu-satunya hal yang penting adalah apakah itu signifikan atau tidak. Yaitu satu hasil yang tidak bisa lebih penting dari yang lain; contoh Anda, baik berasal dari populasi yang sama atau tidak.
Saya memiliki beberapa keraguan dengan ini, tetapi saya mungkin dapat memahami ideologinya:
Ambang 5% adalah arbitrer, yaitu p = 0,051 tidak signifikan dan p = 0,049, seharusnya tidak benar-benar mengubah kesimpulan pengamatan atau percobaan Anda, meskipun satu hasil signifikan dan yang lainnya tidak signifikan.
Alasan saya mengemukakan ini sekarang adalah karena saya sedang belajar untuk gelar MSc dalam Bioinformatika, dan setelah berbicara dengan orang-orang di lapangan, tampaknya ada dorongan yang ditentukan untuk mendapatkan nilai p yang tepat untuk setiap set statistik yang mereka lakukan. Misalnya, jika mereka 'mencapai' nilai p dari p <1,9 × 10 -12 , mereka ingin menunjukkan BAGAIMANA signifikan hasil mereka, dan bahwa hasil ini SUPER informatif. Masalah ini dicontohkan dengan pertanyaan seperti: Mengapa saya tidak bisa mendapatkan nilai p lebih kecil dari 2.2e-16? , di mana mereka ingin mencatat nilai yang menunjukkan bahwa secara kebetulan ini akan menjadi JAUH kurang dari 1 dalam satu triliun. Tetapi saya melihat sedikit perbedaan dalam menunjukkan bahwa hasil ini akan terjadi kurang dari 1 dalam satu triliun dibandingkan dengan 1 dalam satu miliar.
Saya dapat menghargai bahwa p <0,01 menunjukkan bahwa ada kemungkinan kurang dari 1% bahwa ini akan terjadi, sedangkan p <0,001 menunjukkan bahwa hasil seperti ini bahkan lebih tidak mungkin daripada nilai-p yang disebutkan di atas, tetapi haruskah kesimpulan Anda diambil sepenuhnya berbeda? Bagaimanapun keduanya adalah nilai-p yang signifikan. Satu-satunya cara saya bisa membayangkan ingin mencatat nilai-p yang tepat adalah selama koreksi Bonferroni di mana ambang batas berubah karena jumlah perbandingan yang dibuat, sehingga mengurangi kesalahan tipe I. Tetapi bahkan tetap saja, mengapa Anda ingin menunjukkan nilai p yang 12 perintah besarnya lebih kecil dari signifikansi ambang Anda?
Dan bukankah menerapkan koreksi Bonferroni itu sendiri sedikit sewenang-wenang juga? Dalam arti bahwa koreksi awalnya dipandang sangat konservatif, dan oleh karena itu ada koreksi lain yang dapat dipilih untuk mengakses tingkat signifikansi yang dapat digunakan pengamat untuk berbagai perbandingannya. Tetapi karena ini, bukankah titik di mana sesuatu menjadi signifikan pada dasarnya variabel tergantung pada statistik apa yang peneliti ingin gunakan. Haruskah statistik begitu terbuka untuk interpretasi?
Sebagai kesimpulan, bukankah statistik seharusnya tidak terlalu subyektif (walaupun saya kira kebutuhan untuk itu menjadi subyektif adalah sebagai konsekuensi dari sistem multivariat), tetapi pada akhirnya saya ingin beberapa klarifikasi: dapatkah sesuatu lebih penting daripada sesuatu yang lain? Dan akankah p <0,001 cukup untuk mencoba mencatat nilai p yang tepat?