Jika Anda menjalankan uji statistik independen menggunakan sebagai tingkat signifikansi Anda, dan nol diperoleh dalam setiap kasus, apakah Anda akan menemukan atau tidak 'signifikansi' hanyalah hasil dari variabel acak. Secara khusus, ini diambil dari distribusi binomial dengan dan . Misalnya, jika Anda berencana untuk menjalankan 3 tes menggunakan , dan (tanpa sepengetahuan Anda) sebenarnya tidak ada perbedaan dalam setiap kasus, maka ada kemungkinan 5% untuk menemukan hasil yang signifikan dalam setiap tes. Dengan cara ini, tingkat kesalahan tipe I ditahan untukα p = α n = k α = .05 α α α α α o α n e wkαp = αn = kα = .05αuntuk tes secara individual, tetapi di seluruh rangkaian 3 tes tingkat kesalahan tipe I jangka panjang akan lebih tinggi. Jika Anda yakin bahwa ini bermakna untuk mengelompokkan / memikirkan 3 tes ini bersama-sama, maka Anda mungkin ingin menahan tingkat kesalahan tipe I pada untuk set secara keseluruhan , bukan hanya secara individual. Bagaimana seharusnya Anda melakukan ini? Ada dua pendekatan yang berpusat pada pergeseran dari yang asli (yaitu, ) ke nilai baru (yaitu, ):αααHaiαn e w
Bonferroni: sesuaikan digunakan untuk menilai 'signifikansi' sedemikian rupaα
αn e w= αHaik
Dunn-Sidak: sesuaikan menggunakanα
αn e w= 1 - ( 1 - αHai)1 / k
(Perhatikan bahwa Dunn-Sidak mengasumsikan semua tes dalam set independen satu sama lain dan dapat menghasilkan inflasi kesalahan tipe I keluarga jika asumsi itu tidak berlaku.)
Hal ini penting untuk dicatat bahwa ketika melakukan tes, ada dua jenis kesalahan yang Anda ingin menghindari, ketik I (yaitu, mengatakan ada adalah perbedaan ketika tidak ada satu) dan ketik II (yaitu, mengatakan ada tidak perbedaan ketika sebenarnya ada). Biasanya, ketika orang mendiskusikan topik ini, mereka hanya membahas — dan tampaknya hanya menyadari / khawatir dengan — kesalahan tipe I. Selain itu, orang sering lalai menyebutkan bahwa tingkat kesalahan yang dihitung hanya akan berlaku jika semua nol benar. Secara sepele jelas bahwa Anda tidak dapat membuat kesalahan tipe I jika hipotesis nol salah, tetapi penting untuk mengingat fakta itu secara eksplisit dalam pikiran ketika membahas masalah ini.
Saya mengemukakan ini karena ada implikasi dari fakta-fakta ini yang tampaknya sering tidak dipikirkan. Pertama, jika , pendekatan Dunn-Sidak akan menawarkan daya yang lebih tinggi (walaupun perbedaannya bisa sangat kecil dengan kecil ) dan karenanya harus selalu lebih disukai (bila berlaku). Kedua, pendekatan 'step-down' harus digunakan. Artinya, uji efek terbesar pertama; jika Anda yakin bahwa nol tidak diperoleh dalam kasus itu, maka jumlah maksimum kesalahan tipe I yang mungkin adalah , jadi tes berikutnya harus disesuaikan, dan seterusnya. (Ini sering membuat orang tidak nyaman dan terlihat seperti memancing, tetapi ternyata tidakk k - 1 αk > 1kk - 1memancing, karena tes independen, dan Anda bermaksud untuk melakukannya sebelum Anda melihat data. Ini hanya cara menyesuaikan secara optimal.) α
Hal di atas berlaku tidak peduli bagaimana Anda menilai tipe I relatif terhadap kesalahan tipe II. Namun, a-priori tidak ada alasan untuk percaya bahwa kesalahan tipe I lebih buruk daripada tipe II (terlepas dari kenyataan bahwa semua orang tampaknya menganggapnya demikian). Sebaliknya, ini adalah keputusan yang harus dibuat oleh peneliti, dan harus spesifik untuk situasi itu. Secara pribadi, jika saya menjalankan kontras yang disarankan secara teoritis, a-priori , ortogonal, saya biasanya tidak menyesuaikan .α
(Dan untuk menyatakan ini lagi, karena ini penting, semua hal di atas mengasumsikan bahwa tes itu independen. Jika kontrasnya tidak independen, seperti ketika beberapa perawatan masing-masing dibandingkan dengan kontrol yang sama, pendekatan yang berbeda dari penyesuaian , seperti tes Dunnett, harus digunakan.) α