Saya telah mencoba untuk membungkus kepala saya di sekitar bagaimana False Discovery Rate (FDR) harus menginformasikan kesimpulan dari masing-masing peneliti. Misalnya, jika studi Anda kurang bertenaga, haruskah Anda mendiskon hasil Anda meskipun signifikan pada ? Catatan: Saya sedang berbicara tentang FDR dalam konteks memeriksa hasil beberapa studi secara agregat, bukan sebagai metode untuk beberapa koreksi tes.
Membuat asumsi (mungkin murah hati) bahwa dari hipotesis yang diuji adalah benar, FDR adalah fungsi dari tingkat kesalahan tipe I dan tipe II sebagai berikut:
Cukup beralasan bahwa jika sebuah studi kurang bertenaga , kita tidak boleh memercayai hasilnya, bahkan jika hasilnya signifikan, sama seperti kita terhadap studi yang didukung secara memadai. Jadi, seperti yang dikatakan oleh beberapa ahli statistik , ada keadaan di mana, "dalam jangka panjang", kami mungkin mempublikasikan banyak hasil signifikan yang salah jika kita mengikuti pedoman tradisional. Jika suatu badan penelitian dicirikan oleh studi yang secara konsisten kurang bertenaga (misalnya, literatur interaksi gen kandidat lingkungan dekade sebelumnya ), bahkan temuan signifikan yang direplikasi dapat dicurigai.
Menerapkan paket R extrafont
, ggplot2
dan xkcd
, saya pikir ini mungkin berguna dikonseptualisasikan sebagai masalah perspektif:
Dengan informasi ini, apa yang harus dilakukan oleh masing-masing peneliti selanjutnya ? Jika saya memiliki perkiraan tentang seberapa besar efek yang saya pelajari seharusnya (dan karenanya perkiraan , mengingat ukuran sampel saya), haruskah saya menyesuaikan level saya sampai FDR = 0,05? Haruskah saya mempublikasikan hasil pada tingkat bahkan jika studi saya kurang bertenaga dan memberikan pertimbangan FDR kepada konsumen literatur?
Saya tahu ini adalah topik yang telah sering dibahas, baik di situs ini maupun dalam literatur statistik, tetapi sepertinya saya tidak dapat menemukan konsensus pendapat tentang masalah ini.
EDIT: Sebagai tanggapan terhadap komentar @ amoeba, FDR dapat diturunkan dari tabel kontingensi tingkat kesalahan tipe I / tipe II standar (maafkan kejelekannya):
| |Finding is significant |Finding is insignificant |
|:---------------------------|:----------------------|:------------------------|
|Finding is false in reality |alpha |1 - alpha |
|Finding is true in reality |1 - beta |beta |
Jadi, jika kita disajikan dengan temuan yang signifikan (kolom 1), kemungkinan itu salah dalam kenyataannya adalah alpha di atas jumlah kolom.
Tapi ya, kita dapat memodifikasi definisi FDR untuk mencerminkan probabilitas (sebelumnya) bahwa hipotesis yang diberikan adalah benar, meskipun kekuatan studi masih berperan: