Penyesuaian Bonferroni akan selalu memberikan kontrol yang kuat dari tingkat kesalahan keluarga. Ini berarti bahwa, apa pun sifat dan jumlah tes, atau hubungan di antara mereka, jika asumsi mereka terpenuhi, itu akan memastikan bahwa probabilitas bahkan memiliki satu hasil signifikan yang keliru di antara semua tes paling banyak , kesalahan asli Anda tingkat. Karena itu selalu tersedia .α
Apakah tepat untuk menggunakannya (sebagai lawan dari metode lain atau mungkin tidak ada penyesuaian sama sekali) tergantung pada tujuan Anda, standar disiplin Anda dan ketersediaan metode yang lebih baik untuk situasi spesifik Anda. Paling tidak, Anda mungkin harus mempertimbangkan metode Holm-Bonferroni, yang sama umum tetapi kurang konservatif.
Mengenai contoh Anda, karena Anda melakukan beberapa tes, Anda akan meningkatkan tingkat kesalahan keluarga-bijaksana (probabilitas menolak setidaknya satu hipotesis nol keliru). Jika Anda hanya melakukan satu tes pada masing-masing setengahnya, banyak penyesuaian mungkin dilakukan termasuk metode Hommel atau metode yang mengendalikan laju penemuan palsu (yang berbeda dari tingkat kesalahan berdasarkan keluarga). Jika Anda melakukan tes pada seluruh rangkaian data yang diikuti oleh beberapa sub-tes, tes tidak lagi independen sehingga beberapa metode tidak lagi sesuai. Seperti yang saya katakan sebelumnya, Bonferroni selalu tersedia dan dijamin berfungsi seperti yang diiklankan (tetapi juga sangat konservatif ...).
Anda juga bisa mengabaikan seluruh masalah. Secara resmi, tingkat kesalahan keluarga-bijaksana lebih tinggi tetapi dengan hanya dua tes itu masih tidak begitu buruk. Anda juga dapat memulai dengan tes pada seluruh kumpulan data, diperlakukan sebagai hasil utama, diikuti oleh sub-tes untuk kelompok yang berbeda, tidak dikoreksi karena mereka dipahami sebagai hasil sekunder atau hipotesis tambahan.
Jika Anda mempertimbangkan banyak variabel demografis dengan cara itu (bukan hanya merencanakan untuk menguji perbedaan gender sejak awal atau mungkin pendekatan pemodelan yang lebih sistematis), masalahnya menjadi lebih serius dengan risiko signifikan "pengerukan data" (satu perbedaan). keluar signifikan secara kebetulan memungkinkan Anda untuk menyelamatkan percobaan yang tidak meyakinkan dengan beberapa cerita bagus tentang variabel demografis untuk mem-boot padahal sebenarnya tidak ada yang benar-benar terjadi) dan Anda harus mempertimbangkan beberapa bentuk penyesuaian untuk beberapa pengujian. Logikanya tetap sama dengan hipotesis yang berbeda X (menguji hipotesis X dua kali - satu pada setiap setengah dari kumpulan data - mensyaratkan tingkat kesalahan keluarga-bijaksana yang lebih tinggi daripada menguji hipotesis X hanya sekali dan Anda mungkin harus menyesuaikan untuk itu).