Saya mengajar kursus statistik dasar dan hari ini saya akan membahas uji independensi chi-kuadrat untuk dua kategori dan tes untuk homogenitas. Dua skenario ini secara konseptual berbeda, tetapi dapat menggunakan statistik uji dan distribusi yang sama. Dalam uji homogenitas, total marginal untuk salah satu kategori diasumsikan menjadi bagian dari desain itu sendiri - mereka mewakili jumlah mata pelajaran yang dipilih untuk setiap kelompok eksperimen. Tetapi karena uji chi-kuadrat berputar di sekitar pengondisian pada semua total marjinal, tidak ada konsekuensi matematis untuk membedakan antara tes homogenitas dan tes independensi dengan data kategoris - setidaknya tidak ada ketika tes ini digunakan.
Pertanyaan saya adalah sebagai berikut: apakah ada sekolah pemikiran statistik atau pendekatan statistik yang akan menghasilkan analisis yang berbeda, tergantung pada apakah kita menguji independensi (di mana semua marginal adalah variabel acak) atau tes homogenitas (di mana satu set marginal berada diatur oleh desain)?
Dalam kasus berkelanjutan, katakan di mana kita mengamati pada subjek yang sama, dan menguji independensi, atau mengamati pada populasi yang berbeda dan menguji jika mereka berasal dari distribusi yang sama, metodenya berbeda (korelasi analisis vs t-test). Bagaimana jika data kategorikal berasal dari variabel kontinu yang didiskritisasi? Haruskah tes independensi dan homogenitas tidak dapat dibedakan?