Latar Belakang dan Contoh Empiris
Saya punya dua studi; Saya menjalankan percobaan (Studi 1) dan kemudian mereplikasi (Studi 2). Dalam Studi 1, saya menemukan interaksi antara dua variabel; dalam Studi 2, interaksi ini berada dalam arah yang sama tetapi tidak signifikan. Berikut ini adalah ringkasan untuk model Studi 1:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.75882 0.26368 21.840 < 2e-16 ***
condSuppression -1.69598 0.34549 -4.909 1.94e-06 ***
prej -0.01981 0.08474 -0.234 0.81542
condSuppression:prej 0.36342 0.11513 3.157 0.00185 **
Dan model Study 2:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.24493 0.24459 21.444 <2e-16 ***
prej 0.13817 0.07984 1.731 0.0851 .
condSuppression -0.59510 0.34168 -1.742 0.0831 .
prej:condSuppression 0.13588 0.11889 1.143 0.2545
Alih-alih mengatakan, "Saya kira saya tidak punya apa-apa, karena saya 'gagal mereplikasi,'" yang saya lakukan adalah menggabungkan dua set data, menciptakan variabel dummy untuk studi apa data itu berasal, dan kemudian menjalankan interaksi lagi setelah mengendalikan variabel dummy studi. Interaksi ini signifikan bahkan setelah mengendalikannya, dan saya menemukan bahwa interaksi dua arah antara kondisi dan ketidaksukaan / prej ini tidak memenuhi syarat oleh interaksi tiga arah dengan variabel dummy penelitian.
Memperkenalkan Analisis Bayesian
Saya mempunyai seseorang yang menyarankan bahwa ini adalah peluang besar untuk menggunakan analisis Bayesian: Dalam Studi 2, saya memiliki informasi dari Studi 1 yang dapat saya gunakan sebagai informasi sebelumnya! Dengan cara ini, Studi 2 melakukan pembaruan Bayesian dari hasil kuadrat biasa yang paling sering terjadi pada Studi 1. Jadi, saya kembali dan menganalisis kembali model Studi 2, sekarang menggunakan prior informatif pada koefisien: Semua koefisien memiliki normal sebelum di mana rata-rata adalah estimasi dalam Studi 1 dan standar deviasi adalah kesalahan standar dalam Studi 1.
Ini adalah ringkasan dari hasilnya:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.63 0.17 5.30 5.52 5.63 5.74 5.96
condSuppression -1.20 0.20 -1.60 -1.34 -1.21 -1.07 -0.80
prej 0.02 0.05 -0.08 -0.01 0.02 0.05 0.11
condSuppression:prej 0.34 0.06 0.21 0.30 0.34 0.38 0.46
sigma 1.14 0.06 1.03 1.10 1.13 1.17 1.26
mean_PPD 5.49 0.11 5.27 5.41 5.49 5.56 5.72
log-posterior -316.40 1.63 -320.25 -317.25 -316.03 -315.23 -314.29
Sepertinya sekarang kami memiliki bukti yang cukup kuat untuk interaksi dari analisis Studi 2. Ini setuju dengan apa yang saya lakukan ketika saya hanya menumpuk data di atas satu sama lain dan menjalankan model dengan nomor studi sebagai variabel-dummy.
Counterfactual: Bagaimana Jika Saya Berlari Belajar 2 Pertama?
Itu membuat saya berpikir: Bagaimana jika saya menjalankan Studi 2 terlebih dahulu dan kemudian menggunakan data dari Studi 1 untuk memperbarui kepercayaan saya pada Studi 2? Saya melakukan hal yang sama seperti di atas, tetapi secara terbalik: Saya menganalisis kembali data Studi 1 menggunakan estimasi koefisien kuadrat kuadrat biasa dan standar deviasi dari Studi 2 sebagai sarana sebelumnya dan standar deviasi untuk analisis saya terhadap data Studi 1. Hasil ringkasan adalah:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.35 0.17 5.01 5.23 5.35 5.46 5.69
condSuppression -1.09 0.20 -1.47 -1.22 -1.09 -0.96 -0.69
prej 0.11 0.05 0.01 0.08 0.11 0.14 0.21
condSuppression:prej 0.17 0.06 0.05 0.13 0.17 0.21 0.28
sigma 1.10 0.06 0.99 1.06 1.09 1.13 1.21
mean_PPD 5.33 0.11 5.11 5.25 5.33 5.40 5.54
log-posterior -303.89 1.61 -307.96 -304.67 -303.53 -302.74 -301.83
Sekali lagi, kami melihat bukti untuk interaksi, namun ini mungkin tidak selalu demikian. Perhatikan bahwa estimasi titik untuk kedua analisis Bayesian bahkan tidak dalam interval kredibel 95% untuk satu sama lain; dua interval kredibel dari analisis Bayesian memiliki lebih banyak tumpang tindih daripada yang tumpang tindih.
Apa Pembenaran Bayesian Untuk Presedensi Waktu?
Pertanyaan saya adalah: Apa pembenaran yang dimiliki orang Bayesia untuk menghormati kronologi bagaimana data dikumpulkan dan dianalisis? Saya mendapatkan hasil dari Studi 1 dan menggunakannya sebagai prior informatif dalam Studi 2 sehingga saya menggunakan Studi 2 untuk "memperbarui" keyakinan saya. Tetapi jika kita berasumsi bahwa hasil yang saya dapatkan diambil secara acak dari distribusi dengan efek populasi yang sebenarnya ... lalu mengapa saya mengistimewakan hasil dari Studi 1? Apa pembenaran untuk menggunakan hasil Study 1 sebagai prior untuk Study 2 daripada mengambil hasil Study 2 sebagai prior untuk Study 1? Apakah urutan saya mengumpulkan dan menghitung analisis itu penting? Rasanya tidak seperti yang seharusnya bagi saya — apa pembenaran Bayesian untuk ini? Mengapa saya harus percaya bahwa perkiraan poin lebih dekat ke 0,34 daripada ke 0,17 hanya karena saya menjalankan Studi 1 terlebih dahulu?
Menanggapi Jawaban Kodiologis
Kodiologist berkomentar:
Poin kedua dari titik keberangkatan penting yang Anda buat dari konvensi Bayesian. Anda tidak menetapkan prioritas terlebih dahulu dan kemudian cocok dengan kedua model dalam mode Bayesian. Anda cocok dengan satu model dengan gaya non-Bayesian dan kemudian menggunakannya untuk prior untuk model lainnya. Jika Anda menggunakan pendekatan konvensional, Anda tidak akan melihat ketergantungan pada urutan yang Anda lihat di sini.
cond
prej
Estimasi rata-rata dan standar deviasi dari estimasi tersebut hampir sama dengan dalam regresi OLS. Belajar 1:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.756 0.270 5.236 5.573 5.751 5.940 6.289
condSuppression -1.694 0.357 -2.403 -1.925 -1.688 -1.452 -0.986
prej -0.019 0.087 -0.191 -0.079 -0.017 0.040 0.150
condSuppression:prej 0.363 0.119 0.132 0.282 0.360 0.442 0.601
sigma 1.091 0.057 0.987 1.054 1.088 1.126 1.213
mean_PPD 5.332 0.108 5.121 5.259 5.332 5.406 5.542
log-posterior -304.764 1.589 -308.532 -305.551 -304.463 -303.595 -302.625
Dan Pelajaran 2:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.249 0.243 4.783 5.082 5.246 5.417 5.715
condSuppression -0.599 0.342 -1.272 -0.823 -0.599 -0.374 0.098
prej 0.137 0.079 -0.021 0.084 0.138 0.192 0.287
condSuppression:prej 0.135 0.120 -0.099 0.055 0.136 0.214 0.366
sigma 1.132 0.056 1.034 1.092 1.128 1.169 1.253
mean_PPD 5.470 0.114 5.248 5.392 5.471 5.548 5.687
log-posterior -316.699 1.583 -320.626 -317.454 -316.342 -315.561 -314.651
Karena cara ini dan standar deviasi kurang lebih sama dengan perkiraan OLS, efek urutan di atas masih terjadi. Jika saya memasukkan statistik ringkasan posterior dari Studi 1 ke dalam prior ketika menganalisis Studi 2, saya mengamati posterior akhir yang berbeda daripada ketika menganalisis Studi 2 pertama dan kemudian menggunakan statistik ringkasan posterior tersebut sebagai prior untuk menganalisis Studi 1.
Bahkan ketika saya menggunakan cara Bayesian dan standar deviasi untuk koefisien regresi sebagai prior daripada perkiraan sering, saya masih akan mengamati efek urutan yang sama. Jadi pertanyaannya tetap: Apa pembenaran Bayesian untuk mengistimewakan studi yang datang pertama?
rstanarm
atau Stan? Sepertinya pertanyaan itu telah diajukan di sini sebelumnya: stats.stackexchange.com/questions/241690/…
prej
harus sama, kecuali jika saya salah memahami prosedur Anda.