@jbowman telah memberi Anda opsi yang baik. Saya pikir saya mungkin memberikan beberapa informasi mengenai pertanyaan eksplisit Anda tentang kesesuaian uji- vs . χ 2zχ2
z -test:
Ada dua kekhawatiran tentang kesesuaian penggunaan uji- , keduanya tentang apakah distribusi pengambilan sampel yang diasumsikan benar. Pertama, uji- menggunakan distribusi normal alih-alih distribusi- , menyiratkan standar deviasi yang diketahui tanpa kesalahan pengambilan sampel. Kedua, distribusi sampling kontinu, tetapi datanya terpisah; karena hanya kombinasi tertentu dari data yang mungkin, hanya nilai statistik uji realisasi yang dihasilkan yang mungkin, yang mungkin tidak cocok dengan distribusi sampling teoretis. (Saya membahas masalah ini dalam konteks tes lain di sini: Membandingkan dan membandingkan, nilai-p, tingkat signifikansi dan kesalahan tipe I. ) ztzt
Mari kita perhatikan keprihatinan pertama dalam konteks yang berbeda. Jika Anda memiliki dua grup dengan data yang terdistribusi normal, dan Anda ingin melihat apakah rata-rata setara, Anda perlu menghitung rata-rata dan standar deviasi. Sekarang kita tahu bahwa rata-rata tunduk pada kesalahan pengambilan sampel, itu sebabnya kita perlu melakukan tes daripada hanya mengatakan dua sampel berarti tidak identik. Namun, estimasi kami untuk standar deviasi juga harus mengalami kesalahan pengambilan sampel dan kami harus mempertimbangkan fakta itu. Ketika kita melakukan itu, ternyata statistik uji (semacam perbedaan rata-rata berskala) didistribusikan sebagai . Jika kita menggunakan distribusi normal sebagai gantinya (yaitu,z ztz-test), itu berarti kita berasumsi bahwa estimasi kita untuk standar deviasi adalah tanpa kesalahan - sempurna. Jadi mengapa -test dapat digunakan dalam kasus Anda? Alasannya adalah bahwa data Anda adalah binomial (yaitu, jumlah 'keberhasilan' dari total 'percobaan' yang diketahui), bukan normal. Dalam distribusi binomial , standar deviasi adalah fungsi dari mean, jadi setelah Anda memperkirakan mean, tidak ada ketidakpastian tambahan yang harus dikhawatirkan. Dengan demikian, distribusi normal dapat digunakan sebagai model distribusi sampling dari statistik uji. z
Meskipun menggunakan distribusi normal untuk memahami perilaku jangka panjang dari statistik uji secara teknis benar, masalah lain muncul. Masalahnya adalah distribusi normal kontinu, tetapi karena data Anda diskrit, tidak semua nilai dalam distribusi teoretis dapat ditemukan dalam dataset Anda. (Sekali lagi, saya membahas masalah ini secara lebih rinci dalam jawaban yang ditautkan di atas.) Untungnya, kecocokan antara hasil yang mungkin dari data Anda dan distribusi sampling normal teoretis menjadi lebih baik semakin besar Anda . Dalam kasus Anda, tidak peduli apa probabilitas yang mendasari yang sebenarnya, Anda dapat memiliki sebanyak semua kesuksesan atau sesedikit mungkin dalam setiap kelompok. Itu berarti jumlah kombinasi yang mungkin adalah91 × 91 = 1 ,NN = 180 z91×91=1,729, yang banyak kemungkinan. Dengan set data kecil, Anda benar-benar dapat mengalami beberapa jenis masalah yang saya bahas dalam jawaban tertaut saya, tetapi dengan , Anda tidak perlu terlalu khawatir. Saya percaya tes- adalah pilihan yang valid untuk para peneliti. N=180z
χ2 -test:
Tapi bagaimana dengan ? Saya pikir itu juga pilihan yang valid, tetapi itu bukan pilihan pertama saya. (Biarkan saya perhatikan secara sepintas bahwa perhatian kedua yang dibahas di atas - ketidakcocokan antara data diskrit dan distribusi referensi kontinu - berlaku sama seperti pada seperti halnya pada uji- , sehingga ada tidak ada keuntungan di sini.) Masalah denganχ 2 z χ 2 χ 2 z zχ2χ2zχ2-test adalah itu tidak menganggap ada sesuatu yang istimewa tentang total kolom relatif terhadap total baris; keduanya diperlakukan seolah-olah nilai-nilai lain yang mungkin ada. Namun, ini tidak secara akurat mencerminkan pengaturan eksperimental. Ada 180 orang, dan 90 ditugaskan untuk masing-masing kelompok. Satu-satunya hal yang benar-benar akan bervariasi di seluruh studi identik berulang adalah jumlah orang yang masuk angin di setiap kelompok. Uji salah memperlakukan jumlah pilek dan jumlah orang di setiap kelompok seolah-olah mereka dapat bervariasi, tetapi uji- membuat asumsi yang tepat. Itu sebabnya -test memiliki kekuatan lebih di sini. χ2zz
Untuk apa nilainya, tes permutasi yang disarankan oleh @jbowman juga mendapatkan aspek desain Anda dengan benar dan tidak menderita masalah ketidakcocokan diskrit-kontinu. Jadi, ini adalah pilihan terbaik. Tapi saya pikir Anda mungkin ingin tahu sedikit lebih banyak tentang bagaimana - dan membandingkan dalam situasi Anda. χ 2zχ2