Apa bedanya menggunakan Fisher Exact Test vs Regresi Logistik untuk


10

Untuk sebuah 2×2 tabel, dua cara untuk melakukan inferensi di atas meja adalah melalui Fisher Exact Test dan juga Regresi Logistik.

Saya diberi tahu bahwa menggunakan Fisher's Exact Test, kami hanya tertarik pada kehadiran asosiasi. Tetapi dengan Regresi Logistik, kami tertarik pada besarnya asosiasi.

Namun, saya tidak mengerti kenapa. Misalnya, dalam uji eksak Fisher yang dilakukan dalam R, ia mengembalikan Odds Ratio dengan Interval Keyakinan, sementara dengan Regresi Logistik, kami dikembalikan dengan intersep dan kemiringan, yang keduanya sesuai dengan peluang log dan peluang log perbandingan.

Pertanyaan saya adalah , di mana Regresi Logistik memberi kita besarnya asosiasi? Saya berasumsi itu ada diβ1koefisien, tapi itu hanya rasio odds log, yang menghasilkan tes Fisher juga . Apa perbedaannya?

Jawaban:


2

Saya tidak yakin apa yang Anda maksud dengan "Regresi Logistik memberi kita tingkat keterkaitan" karena ketika Anda menyatakan uji pasti fisher melakukan sesuatu yang sangat mirip. Tapi tetap saja, ada beberapa perbedaan yang bisa saya pikirkan.

1. Rasio odds (OR) dapat berbeda

ATAU yang dilaporkan tidak harus sama. Setidaknya ini berlaku untuk fungsi R fisher.test () dan exact2x2 () versus regresi logistik melalui fungsi glm (). Berikut sebuah contoh:

# generating data
set.seed(1)
n <- 200
x <- rbinom(n, 1, .5)
y <- rbinom(n, 1, .4)
df <- data.frame(x, y)

# OR from logistic regression
exp(coef(glm(y ~ x,family=binomial(link='logit'),data= df)))[2]
1.423077

# OR from fisher's exact test
tab <- table(x, y)
fisher.test(tab)$estimate
1.420543 # the methods "minlike", "central" and "blaker" in the exact2x2 function result in the same OR

# calculating OR by hand
(tab[1,1]/ tab[2,1])/ (tab[1,2]/ tab[2,2])
1.423077

OR dari uji eksak yang berbeda dari yang dihitung dengan tangan atau dilaporkan dalam regresi logistik karena mereka dihitung dengan Estimasi Kemungkinan Maksimum bersyarat dan bukan oleh MLE tanpa syarat (sampel OR). Mungkin ada situasi di mana nilai ATAU berbeda lebih dari pada contoh saya. Dan lagi, OR berbeda untuk fungsi-fungsi yang disebutkan tetapi mungkin ada varian lain dari tes mereka adalah sama.

2. nilai p berbeda

Tentu saja nilai p berbeda karena dalam kasus regresi logistik mereka ditentukan dengan statistik Wald dan nilai az sementara ada berbagai jenis uji fisher yang bahkan berbeda dalam nilai p di antara mereka sendiri (link terakhir membuka pdf). Lihat di sini untuk data yang digunakan sebelumnya:

# p value from logistic regression
summary(glm(y ~ x,family=binomial(link='logit'),data= df))$coefficients["x", "Pr(>|z|)"]
0.2457947

# p value from fisher's exact test
library(exact2x2) # package covers different exact fisher's tests, see here https://cran.r-project.org/web/packages/exact2x2/index.html

exact2x2(tab,tsmethod="central")$p.value
0.3116818
exact2x2(tab,tsmethod="minlike")$p.value
0.290994 # which is same as fisher.test(tab)$p.value and exact2x2(tab,tsmethod="blaker")$p.value

Di sini dalam semua kasus orang akan menyimpulkan bahwa tidak ada efek yang signifikan. Tapi tetap saja, seperti yang Anda lihat perbedaannya tidak sepele (0,246 untuk regresi logistik versus 0,291 atau bahkan 0,312 untuk uji fisher tepat). Jadi tergantung pada apakah Anda menggunakan regresi logistik atau uji pasti fisher Anda bisa sampai pada kesimpulan lain apakah ada efek yang signifikan atau tidak.

3. Membuat prediksi

Untuk membuat analogi: korelasi Pearson dan regresi linier sangat mirip dalam kasus bivariat dan koefisien regresi standar bahkan sama dengan korelasi Pearson r. Tetapi Anda tidak dapat membuat prediksi dengan korelasi karena tidak ada intersepsi. Demikian pula, bahkan jika rasio odds dari regresi logistik dan uji eksak fisher adalah sama (apa yang tidak terjadi seperti yang dibahas pada poin 1) Anda tidak dapat membuat prediksi dengan hasil uji eksak fisher. Di sisi lain, regresi logistik memberi Anda intersep dan koefisien yang diperlukan untuk membuat prediksi.

4. Kinerja

Perbedaan yang disebutkan sebelumnya dapat menyebabkan asumsi bahwa harus ada perbedaan dalam kinerja kedua tes dalam hal kekuatan dan kesalahan tipe I. Ada beberapa sumber yang menyatakan bahwa uji eksak fisher terlalu konservatif. Di sisi lain, orang harus ingat bahwa analisis regresi logistik standar adalah asimptotik, jadi dengan beberapa pengamatan Anda mungkin akan lebih memilih tes eksak fisher .

Singkatnya , meskipun kedua tes dapat digunakan untuk data yang sama, ada beberapa perbedaan yang dapat menyebabkan hasil yang berbeda dan dengan demikian menghasilkan kesimpulan yang berbeda. Jadi itu tergantung pada situasi yang mana dari dua tes yang ingin Anda gunakan - dalam kasus prediksi itu akan menjadi regresi logistik, dalam kasus sampel ukuran kecil tes eksak fisher, dan sebagainya. Mungkin ada lebih banyak perbedaan yang saya tinggalkan tetapi mungkin seseorang dapat mengedit dan menambahkannya.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.