Diberikan daftar nilai-p yang dihasilkan dari tes independen, diurutkan dalam urutan menaik, seseorang dapat menggunakan prosedur Benjamini-Hochberg untuk koreksi pengujian ganda . Untuk setiap nilai-p, prosedur Benjamini-Hochberg memungkinkan Anda untuk menghitung False Discovery Rate (FDR) untuk masing-masing nilai-p. Yaitu, pada setiap "posisi" dalam daftar nilai-p yang diurutkan, ia akan memberi tahu Anda berapa proporsi dari mereka yang kemungkinan merupakan penolakan palsu dari hipotesis nol.
Pertanyaan saya adalah, apakah nilai-nilai FDR ini disebut sebagai " nilai-q ", atau sebagai " nilai-p yang dikoreksi ", atau sebagai sesuatu yang lain sama sekali?
EDIT 2010-07-12: Saya ingin lebih menjelaskan prosedur koreksi yang kami gunakan. Pertama, kami mengurutkan hasil tes dalam urutan yang meningkat dengan nilai p aslinya yang tidak diperbaiki. Kemudian, kita mengulangi daftar, menghitung apa yang telah saya tafsirkan sebagai "FDR yang diharapkan jika kita menolak hipotesis nol untuk ini dan semua tes sebelumnya dalam daftar," menggunakan koreksi BH, dengan alfa sama dengan yang diamati , nilai p yang tidak dikoreksi untuk iterasi masing-masing. Kami kemudian mengambil, seperti apa yang kami sebut sebagai "nilai-q" kami, maksimum dari nilai yang sebelumnya dikoreksi (FDR pada iterasi i - 1) atau nilai saat ini (at i), untuk menjaga monotonitas.
Di bawah ini adalah beberapa kode Python yang mewakili prosedur ini:
def calc_benjamini_hochberg_corrections(p_values, num_total_tests):
"""
Calculates the Benjamini-Hochberg correction for multiple hypothesis
testing from a list of p-values *sorted in ascending order*.
See
http://en.wikipedia.org/wiki/False_discovery_rate#Independent_tests
for more detail on the theory behind the correction.
**NOTE:** This is a generator, not a function. It will yield values
until all calculations have completed.
:Parameters:
- `p_values`: a list or iterable of p-values sorted in ascending
order
- `num_total_tests`: the total number of tests (p-values)
"""
prev_bh_value = 0
for i, p_value in enumerate(p_values):
bh_value = p_value * num_total_tests / (i + 1)
# Sometimes this correction can give values greater than 1,
# so we set those values at 1
bh_value = min(bh_value, 1)
# To preserve monotonicity in the values, we take the
# maximum of the previous value or this one, so that we
# don't yield a value less than the previous.
bh_value = max(bh_value, prev_bh_value)
prev_bh_value = bh_value
yield bh_value