Analisis Bayesian dari tabel kontingensi: Cara menggambarkan ukuran efek

Saya sedang mengerjakan contoh-contoh dalam Analisis Data Does Bayesian Kruschke , khususnya ANOVA eksponensial Poisson di bab. 22, yang ia sajikan sebagai alternatif untuk uji chi-square independensi untuk tabel kontingensi.

Saya dapat melihat bagaimana kita mendapatkan informasi tentang interaksi yang terjadi lebih atau kurang dari yang diharapkan jika variabelnya independen (mis. Ketika HDI tidak termasuk nol).

Pertanyaan saya adalah bagaimana saya bisa menghitung atau menafsirkan ukuran efek dalam kerangka kerja ini? Sebagai contoh, Kruschke menulis "kombinasi mata biru dengan rambut hitam terjadi lebih jarang daripada yang diharapkan jika warna mata dan warna rambut independen", tetapi bagaimana kita bisa menggambarkan kekuatan hubungan itu? Bagaimana saya bisa tahu interaksi mana yang lebih ekstrim dari yang lain? Jika kami melakukan uji chi-square data ini, kami mungkin menghitung V Cramér sebagai ukuran ukuran efek keseluruhan. Bagaimana cara saya menyatakan ukuran efek dalam konteks Bayesian ini?

Ini contoh mandiri dari buku (dikodekan R), kalau-kalau jawabannya tersembunyi dari saya di depan mata ...

df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15, 
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond", 
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))

df

         Blue Brown Green Hazel
Black      20    68     5    15
Blond      94     7    16    10
Brunette   84   119    29    54
Red        17    26    14    14

Berikut ini adalah output yang sering, dengan ukuran ukuran efek (tidak ada di buku):

vcd::assocstats(df)
                    X^2 df P(> X^2)
Likelihood Ratio 146.44  9        0
Pearson          138.29  9        0

Phi-Coefficient   : 0.483 
Contingency Coeff.: 0.435 
Cramer's V        : 0.279

Inilah output Bayesian, dengan HDI dan probabilitas sel (langsung dari buku):

# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R", 
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")

# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))

# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))

Dan berikut adalah plot posterior model eksponensial Poisson yang diterapkan pada data:

masukkan deskripsi gambar di sini

Dan plot distribusi posterior pada perkiraan probabilitas sel:

masukkan deskripsi gambar di sini

r bayesian effect-size contingency-tables

— Ben
sumber

Jawaban:

Per indeks, Kruschke hanya menyebutkan ukuran efek dua kali, dan kedua kali berada dalam konteks variabel prediksi metrik. Tapi ada sedikit di h. 601:

Jika peneliti tertarik pada pelanggaran kemerdekaan, maka bunga adalah pada besarnya . Model ini terutama sesuai untuk tujuan ini, karena kontras interaksi sewenang-wenang dapat diselidiki untuk menentukan di mana kemandirian timbul. $\beta_{rc}$

Jadi, saya kumpulkan bahwa adalah parameter untuk ditafsirkan. Biarkan sama dengan jumlah produk dari semua koefisien dan elemen x yang sesuai, tidak termasuk dan . Karena dan . Ketika = 1, maka tumbuh atau menyusut dengan faktor , bukan? $\beta_{1,2}$ $S$ $\beta_{1,2}$ $x_{1,2}$ $y_i {\raise.17ex\hbox{$\scriptstyle\sim$}} Pois(\lambda_i)$ $\lambda_i = e^{\beta_{1,2} x_{1,2} + S} = e^{\beta_{1,2} x_{1,2}} e^S$ $x_{1,2}$ $\lambda_i$ $e^{\beta_{1,2}}$

— Sean Easter
sumber

Salah satu cara untuk mempelajari ukuran efek dalam model ANOVA adalah dengan melihat standar deviasi "populasi super" dan populasi terbatas ". Anda memiliki tabel dua arah, jadi ini adalah 3 komponen varians (2 efek utama dan 1 interaksi). Ini didasarkan pada analisis mcmc. Anda menghitung standar deviasi untuk setiap efek untuk setiap sampel mcmc.

s_{k} = \sqrt{\frac{1}{d_{k} - 1} \sum_{j = 1}^{d_{k}} (β_{k, j} - {\bar{β}}_{k})^{2}}

$s_k=\sqrt{\frac{1}{d_k-1}\sum_{j=1}^{d_k}(\beta_{k, j}-\overline {\beta}_k)^2}$

Di mana mengindeks "baris" dari tabel ANOVA. Boxplot sederhana dari sampel mcmc dari vs cukup instruktif pada ukuran efek. $k$ $s_k$ $k$

Andrew Gelman menganjurkan pendekatan ini. Lihat makalahnya 2005 "analisis varian: mengapa itu lebih penting dari sebelumnya"

— probabilityislogic
sumber

Makalah itu tersedia di sini .

— Sean Easter

Kedua jawaban ini tampaknya sangat menjanjikan, terima kasih. Apakah Anda berdua cukup akrab Runtuk menunjukkan bagaimana itu dapat diprogram?

— Ben

@ seaneaster - terima kasih telah menambahkan tautan. @ Ben, perhitungan ini sederhana dalam R. Namun saya tidak yakin dalam bentuk apa sampel Anda. Anda harus dapat menggunakan sd ()dikombinasikan dengan salah satu fungsi "terapkan". Adapun plot box, ini mudah untuk mendapatkan yang dasar boxplot ().

— probabilityislogic

Terima kasih, dapatkah Anda mendemonstrasikan menggunakan contoh data dan kode dalam pertanyaan saya?

— Ben

Singkatnya, tidak karena saya tidak mengerti kode yang Anda posting - saya tidak bisa melihat bagaimana data disusun. Dan seperti yang saya katakan, ini bukan analisis yang sulit untuk dilakukan sendiri. Pendekatan ini menghitung ukuran sederhana (standar deviasi). Selain itu, pengkodean R bukan bagian dari pertanyaan Anda - Anda bertanya tentang bagaimana meringkas analisis tabel kontingensi.

— probabilityislogic