Saya tertarik pada pemodelan data respons biner dalam observasi berpasangan. Kami bertujuan untuk membuat kesimpulan tentang efektivitas intervensi pra-pasca dalam suatu kelompok, berpotensi menyesuaikan diri untuk beberapa kovariat dan menentukan apakah ada modifikasi efek oleh kelompok yang menerima pelatihan yang sangat berbeda sebagai bagian dari intervensi.
Diberikan data dari formulir berikut:
id phase resp
1 pre 1
1 post 0
2 pre 0
2 post 0
3 pre 1
3 post 0
Dan tabel kontingensi informasi tanggapan berpasangan:
Kami tertarik pada pengujian hipotesis: .
Uji McNemar memberikan: bawah (asimptotik). Ini intuitif karena, di bawah nol, kami berharap proporsi yang sama dari pasangan sumbang ( dan ) lebih menyukai efek positif ( ) atau efek negatif ( ). Dengan probabilitas definisi case positif didefinisikan dan . Peluang untuk mengamati pasangan sumbang positif adalah . H0bcbcp=b n=b+cp
Di sisi lain, regresi logistik bersyarat menggunakan pendekatan yang berbeda untuk menguji hipotesis yang sama, dengan memaksimalkan kemungkinan bersyarat:
di mana .
Jadi, apa hubungan antara tes-tes ini? Bagaimana seseorang dapat melakukan tes sederhana dari tabel kontingensi yang disajikan sebelumnya? Melihat kalibrasi nilai-p dari pendekatan clogit dan McNemar di bawah nol, Anda akan berpikir mereka sama sekali tidak berhubungan!
library(survival)
n <- 100
do.one <- function(n) {
id <- rep(1:n, each=2)
ph <- rep(0:1, times=n)
rs <- rbinom(n*2, 1, 0.5)
c(
'pclogit' = coef(summary(clogit(rs ~ ph + strata(id))))[5],
'pmctest' = mcnemar.test(table(ph,rs))$p.value
)
}
out <- replicate(1000, do.one(n))
plot(t(out), main='Calibration plot of pvalues for McNemar and Clogit tests',
xlab='p-value McNemar', ylab='p-value conditional logistic regression')
exact2x2
dapat menjadi referensi.