Saya akan menganggap bahwa "kelangsungan hidup 100%" berarti bahwa situs Anda hanya berisi satu organisme. jadi 30 berarti 30 organisme mati, dan 31 berarti 31 organisme tidak. Berdasarkan hal ini chi-square harus baik-baik saja, tetapi hanya akan memberi tahu hipotesis mana yang tidak didukung oleh data - itu tidak akan memberi tahu Anda apakah dua hipotesis masuk akal lebih baik atau tidak. Saya menyajikan analisis probabilitas yang mengekstraksi informasi ini - itu setuju dengan uji chi-square, tetapi memberi Anda lebih banyak informasi daripada uji chi-square, dan cara yang lebih baik untuk menyajikan hasilnya.
Model adalah model bernouli untuk indikator "kematian", ( menunjukkan sel dari tabel , dan menunjukkan unit individu dalam sel).i 2 × 3 jYsaya j∼ B i n ( 1 , θsaya j)saya2 × 3j
Ada dua asumsi global yang mendasari uji chi-square:
- dalam sel tabel yang diberikan, semuanya sama, yaitu θ i j = θ i k = θ iθsaya jθsaya j= θsaya k= θsaya
- yang secara statistik independen, mengingat . Ini berarti bahwa parameter probabilitas memberi tahu Anda segala sesuatu tentang - semua informasi lain tidak relevan jika Anda tahu θ i Y i j θ iYsaya jθsayaYsaya jθsaya
Nyatakan sebagai jumlah , (jadi ) dan biarkan menjadi ukuran grup (jadi ). Sekarang kami memiliki hipotesis untuk diuji: Y i j X 1 = 30 , X 2 = 10 , X 3 = 1 N i N 1 = 61 , N 2 = 30 , N 3 = 11XsayaYsaya jX1= 30 , X2= 10 , X3= 1NsayaN1= 61 , N2= 30 , N3= 11
HSEBUAH: θ1= θ2, θ1= θ3, θ2= θ3
Tapi apa alternatifnya? Saya akan mengatakan kombinasi lain yang mungkin sama atau tidak sama.
H B 2 : θ 1 ≠ θ 2 , θ 1 = θ 3 , θ 2 ≠ θ 3 H B 3 : θ 1 = θ 2 , θ 1 ≠ θ 3 , θ 2 ≠
HB 1: θ1≠ θ2, θ1≠ θ3, θ2= θ3
HB 2: θ1≠ θ2, θ1= θ3, θ2≠ θ3
HB 3: θ1= θ2, θ1≠ θ3, θ2≠ θ3
HC: θ1≠ θ2, θ1≠ θ3, θ2≠ θ3
Salah satu hipotesis ini harus benar, mengingat asumsi "global" di atas. Tetapi perhatikan bahwa tidak satupun dari ini yang menentukan nilai spesifik untuk tarif - sehingga mereka harus diintegrasikan. Sekarang mengingat benar, kami hanya memiliki satu parameter (karena semuanya sama), dan seragam sebelumnya adalah pilihan konservatif, menyatakan ini dan asumsi global oleh . jadi kita punya:HSEBUAHsaya0
P( X1, X2, X3| N1, N2, N3, HSEBUAH, saya0) = ∫10P( X1, X2, X3, θ | N1, N2, N3, HSEBUAH, saya0) dθ
= ( N1X1) ( N2X2) ( N3X3) ∫10θX1+ X2+ X3( 1 - θ )N1+ N2+ N3- X1- X2- X3dθ
= ( N1X1) ( N2X2) ( N3X3)( N1+ N2+ N3+ 1 ) ( N1+ N2+ N3X1+ X2+ X3)
Yang merupakan distribusi hypergeometrik dibagi dengan konstanta. Demikian pula untuk kita akan memiliki:
HB 1
P( X1, X2, X3| N1, N2, N3, HB 1, saya0) = ∫10P( X1, X2, X3, θ1θ2| N1, N2, N3, HB 1,saya0) dθ1dθ2
= ( N2X2) ( N3X3)( N1+ 1 ) ( N2+ N3+ 1 ) ( N2+ N3X2+ X3)
Anda dapat melihat pola untuk yang lain. Kita dapat menghitung peluang untuk mengatakan dengan hanya membagi dua ekspresi di atas. Jawabannya adalah sekitar , yang berarti data mendukung lebih dari sekitar faktor - bukti yang cukup lemah dalam mendukung tingkat yang sama. Probabilitas lain diberikan di bawah ini.HSEBUAHv sHB 14HSEBUAHHB 14
Hyp o t h e s i s( HSEBUAH| D)( HB 1| D)( HB 2| D)( HB 3| D)( HC| D)p r o b a b i l i t y0,0189822650,0047906690,0516200220.4841558740.440451171
Ini menunjukkan bukti kuat terhadap tingkat yang sama, tetapi tidak dalam bukti kuat mendukung alternatif defintie. Sepertinya ada bukti kuat bahwa laju "lepas pantai" berbeda dengan dua tarif lainnya, tetapi bukti yang tidak meyakinkan tentang apakah tarif "dalam negeri" dan "saluran tengah" berbeda. Inilah yang tes chi-square tidak akan memberi tahu Anda - itu hanya memberi tahu Anda bahwa hipotesis adalah "omong kosong" tetapi bukan alternatif apa yang harus ditempatkan pada tempatnya.SEBUAH