Mengapa rasio odds dari formula dan fisher'stest berbeda? Yang mana yang harus dipilih?


14

Dalam contoh berikut

> m = matrix(c(3, 6, 5, 6), nrow=2)
> m
     [,1] [,2]
[1,]    3    5
[2,]    6    6
> (OR = (3/6)/(5/6))    #1
[1] 0.6
> fisher.test(m)        #2

    Fisher's Exact Test for Count Data

data:  m 
p-value = 0.6699
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval:
 0.06390055 5.07793271 
sample estimates:
odds ratio 
 0.6155891 

Saya menghitung rasio odds (# 1) "secara manual", 0,600; kemudian (# 2) sebagai salah satu output dari uji eksak Fisher, 0,616.

Mengapa saya tidak mendapatkan nilai yang sama?

Mengapa beberapa cara menghitung odds-ratio ada, dan bagaimana memilih yang paling tepat?

Jawaban:


10

Dari halaman bantuan untuk fisher.test():

Perhatikan bahwa Estimasi Kemungkinan Maksimum bersyarat (MLE) daripada MLE tanpa syarat (rasio peluang sampel) digunakan.


3

Untuk menambah diskusi di sini, penting untuk bertanya apa sebenarnya yang dikondisikan dalam kemungkinan "kondisional" ini. Uji Fisher berbeda dari analisis kategorikal lain karena menganggap semua margin tabel diperbaiki sementara model regresi logistik (dan uji chi-square Pearson yang sesuai yang merupakan tes skor dari model logistik) hanya menganggap satu margin diperbaiki .

Uji Fisher kemudian mempertimbangkan distribusi hipergeometrik sebagai model probabilitas untuk jumlah yang diamati pada masing-masing 4 sel. Distribusi hypergeometrik memiliki kekhasan bahwa, karena distribusi rasio odds yang berasal tidak kontinu, Anda sering mendapatkan OR yang berbeda sebagai perkiraan kemungkinan maksimum.


2
Saya tidak berpikir jawaban Anda menjelaskan bagaimana kemungkinan ini muncul. Jika Anda memodelkan proses pembuatan data dengan binomial produk, katakanlah, Anda mendapatkan kemungkinan (& MLE) yang berbeda pada total marjinal, dari apa yang Anda dapatkan jika Anda memodelkannya dengan distribusi hypergeometrik non-sentral Wallenius - marginal total "dianggap tetap" dalam kedua kasus.
Scortchi

1

Untuk menjawab pertanyaan kedua Anda, biostats bukan keahlian saya, tetapi saya percaya alasan untuk statistik rasio odds berganda adalah untuk memperhitungkan desain pengambilan sampel dan desain eksperimen.

Saya telah menemukan tiga referensi di sini yang akan memberi Anda sedikit pemahaman tentang mengapa ada perbedaan antara MLE bersyarat vs tanpa syarat untuk rasio odds, serta jenis lainnya.

  1. Estimasi titik dan interval dari rasio odds umum dalam kombinasi 2 × 2 tabel dengan margin tetap

  2. Pengaruh Bias pada Estimator Risiko Relatif untuk Pasangan yang Cocok dan Sampel Bertingkat

  3. Studi Komparatif Estimasi Kemungkinan Maksimum Bersyarat dari Rasio Peluang Umum


3
Akan bermanfaat untuk merangkum setidaknya sedikit apa yang dikatakan oleh referensi tersebut.
Scortchi

@Scortchi, setuju. Saya sibuk dengan pekerjaan dan hanya memiliki kesempatan untuk membaca masing-masing halaman pertama atau kedua. Saya akan menambahkan ringkasan setiap akhir pekan ini.
Jon

@Jon Jika Anda bisa, akan berguna untuk menambahkan ringkasan singkat itu
Glen_b -Reinstate Monica

@Jon, saya hanya bertanya satu pertanyaan. Itu bli yang menambahkan pertanyaan kedua 4 tahun setelah saya memposting pertanyaan asli saya. Saya tidak membalikkan suntingan bli yang menyebalkan saat Anda mereferensikan pertanyaan kedua, tetapi saya tidak yakin bagaimana menerima jawaban lagi.
winerd
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.