Bagaimana cara mewakili variabel perbedaan dengan benar di DAG?

Jika saya tertarik pada efek sebab akibat dari perubahan dalam suatu variabel ( $E$ ) pada beberapa hasil ( $O$ ), bagaimana saya menyatakan bahwa dalam grafik asiklik terarah (DAG)?

Seharusnya $\Delta E_2 = E_2 - E_1$ dimana $E_1$ & $E_2$ terjadi pada waktu 1 & 2, apakah DAG yang benar adalah:

1. Dengan asumsi itu $\Delta E_2$ hanya ditangkap oleh semua tingkatan $E_1$ dan $E_2$ ( ala cara efek interaksi yang sama begitu ditangkap)?

DAG 1: E_1 dan E_2 keduanya menyebabkan O

2. Dengan asumsi itu $\Delta E_2$ adalah variabel sebab akibat yang berbeda $E_1$ dan $E_2$ , tetapi membutuhkan keberadaan variabel-variabel tersebut?

DAG 2: E_1, E_2, & Delta E semuanya menyebabkan O

3. Dengan asumsi itu $\Delta E_2$ independen dari $E_1$ & $E_2$ dan yang terakhir tidak perlu untuk mewakili efek dari $\Delta E_2$ ?

DAG 3: Delta E menyebabkan O

Sesuatu yang lain

CATATAN: " DAG " tidak berarti "jenis grafik sebab akibat atau korelasional," tetapi formalisme yang dilarang keras mewakili kepercayaan kausal.

Motivasi saya adalah saya mencoba memikirkan representasi DAG dari model dinamis seperti model koreksi kesalahan umum:

Δ O_{t} = β_{0} + β_{c} (O_{t - 1} - E_{t - 1}) + β_{Δ E} Δ E_{t} + β_{E} E_{t - 1} + ε_{t}

$\Delta O_t = \beta_{0} + \beta_{\text{c}}\left(O_{t-1} - E_{t-1}\right) + \beta_{\Delta E}\Delta E_{t} + \beta_E E_{t-1} + \varepsilon_t$

Tentu saja, estimasi parameter mentah dapat ditransformasikan untuk menafsirkan model seperti di bawah ini, jadi mungkin DAGing model di atas akan lebih berantakan?

Efek instan perubahan jangka pendek $E$ di $\Delta O$ : $\beta_{\Delta E}$

Efek jangka pendek dari level $E$ di $\Delta O$ : $\beta_{E} - \beta_{\text{c}} - \beta_{\Delta E}$

Efek ekuilibrium jangka panjang dari lagged $E$ di $\Delta O$ : $\frac{\beta_{\text{c}} - \beta_{E}}{\beta_{\text{c}}}$

time-series dag

— Alexis
sumber

Jawaban:

Solusinya adalah berpikir secara fungsional.

Nilai dari $\Delta E_{2} = f(E_{1},E_{2})$ lebih spesifik $\Delta E_{2} = E_{2} - E_{1}$ . Oleh karena itu variabel perbedaan dapat direpresentasikan dalam DAG dengan opsi 4, "sesuatu yang lain" (DAG ini mengasumsikan $E_{1}$ dan $E_{2}$ langsung menyebabkan $O$ selain perbedaan mereka):

DAG dari variabel perbedaan dengan efek langsung dari variabel induk

Jika $E_{1}$ & $E_{2}$ tidak memiliki efek langsung $O$ , $\Delta E_{2}$ masih tetap menjadi fungsi orang tuanya:

DAG dari variabel perbedaan tanpa efek langsung dari variabel induk

Jika kita menulis ulang model koreksi kesalahan umum jeda tunggal ( $Q_{t-1}$ untuk 'istilah eQuilibrium', di mana $Q_{t-1} = O_{t-1} - E_{t-1}$ ):

Δ O_{t} = β_{0} + β_{c} (Q_{t - 1}) + β_{Δ E} Δ E_{t} + β_{E} E_{t - 1} + ε_{t}

$\Delta O_t = \beta_{0} + \beta_{\text{c}}\left(Q_{t-1}\right) + \beta_{\Delta E}\Delta E_{t} + \beta_E E_{t-1} + \varepsilon_t$

Kemudian DAG yang mendasari model untuk $\Delta O_{t}$ (Mengabaikan keturunannya di $t+1$ ) adalah:

Segmen aDAG pada waktu t untuk model koreksi kesalahan umum

Efek dari $E$ di $\Delta O_{t}$ dari model demikian masuk dari istilah ekuilibrium $Q_{t-1}$ dari $E_{t-1}$ dan dari istilah perubahan $\Delta E_{t}$ . Penyebab lain dari $O_{t-1}$ , $O_{t}$ , $E_{t-1}$ dan $E_{t}$ (misalnya, variabel yang tidak dimodelkan, input acak) dibiarkan implisit.

Bagian dari jawaban ini sesuai dengan dua DAG pertama adalah milik komunikasi pribadi dengan Miguel Hernán.

— Alexis
sumber

EDIT:

Jika Anda hanya ingin merepresentasikan hubungan nonparametrik di antara variabel-variabel Anda, saya pikir 1) akan lebih tepat. Meskipun mungkin ada bentuk fungsional yang lebih spesifik yang menghubungkan dua variabel dengan hasil, dalam DAG tidak perlu untuk mewakili formulir itu. Di sisi lain, jika Anda ingin menggunakan diagram jalur yang mewakili model persamaan struktural linier seperti yang Anda tulis, masuk akal untuk memasukkan skor perbedaan dalam diagram; dengan cara ini, model spesifik yang Anda tulis dan diagram akan sama spesifiknya. DAG lebih kabur (tetapi juga lebih fleksibel) karena tidak memerlukan (atau memungkinkan yang diperlukan) untuk bentuk fungsi tertentu.

Mungkin sampai pada tujuan menggambar DAG Anda. Jika tujuan Anda direpresentasikan dengan sebanyak mungkin hubungan di antara variabel-variabel Anda, masuk akal untuk memasukkan istilah perbedaan sebagai variabelnya sendiri karena ia memang memiliki kekuatan kausal sendiri. Grafik tanpa itu juga akan valid. Secara teori, Anda bisa membuat pernyataan independensi bersyarat yang sama tentang hasil dan prediktor dengan DAG yang lebih rinci daripada dengan yang kurang detail.

Intuisi saya paling dekat dengan 3). Jika itu benar $E_1$ dan $E_2$ jangan langsung mempengaruhi $O$ kecuali melalui perbedaan mereka, maka 3) sudah benar, dan saya akan menambahkan tepi dari $E_1$ dan $E_2$ untuk $\Delta E_2$ dan dari $E_1$ untuk $E_2$ untuk kelengkapan. Tidak ada node lain yang akan menunjuk ke variabel perbedaan, tetapi variabel yang memprediksi perbedaan akan menunjukkan sebaliknya $E_1$ dan / atau $E_2$ . Secara grafis, apa yang saya uraikan adalah:

E1
 |---->  E2-E1 ---> O
 V       ^
E2-------|

dengan kemungkinan panah tambahan dari $E_1$ dan $E_2$ untuk $O$ jika mereka mempengaruhi $O$ di luar pengaruh mereka melalui perbedaan mereka.

— Nuh
sumber

"Jika memang benar bahwa E1 dan E2 tidak secara langsung mempengaruhi O kecuali melalui perbedaan mereka," Kamu tampaknya mengabaikan model yang saya tentukan.

— Alexis

Perhatian kedua. Variabel interaksi

E_{1} \times E_{2}

$E_{1}\times E_{2}$ adalah murni fungsi dari

E_{1}

$E_{1}$ dan

E_{2}

$E_{2}$ Namun, variabel tersebut tidak akan direpresentasikan sebagai Anda telah ditarik DAG dalam jawaban Anda , sehingga sama sekali tidak jelas bagi saya bahwa bahkan jika saya sedang tertarik dalam model

Δ O = β_{0} + Δ E_{2} + ε

$\Delta O = \beta_{0} + \Delta E_{2} + \varepsilon$ bahwa DAG Anda akan benar.

— Alexis

Itu adalah keprihatinan yang baik. Saya mengabaikan model yang Anda tentukan dan berfokus pada pertanyaan Anda. Apakah Anda ingin menentukan diagram jalur yang mewakili model persamaan struktural linier atau DAG nonparametrik? Jika yang pertama, Anda ingin memasukkan istilah perbedaan sebagai variabelnya sendiri. Kalau tidak, seperti yang Anda sebutkan, akan lebih baik untuk tidak (seperti halnya dengan interaksi). Saya akan merevisi jawaban saya.

— Noah

Pertanyaannya tidak ada hubungannya dengan SEM. Anda bisa tahu karena SEM tidak muncul dalam pertanyaan, bahkan sebagai tag. :) Di sisi lain pertanyaan saya adalah semua tentang DAG. :) Juga: mengenai komentar kedua saya "sama sekali tidak jelas" tidak berarti Anda tidak benar ... hanya berarti saya perlu meyakinkan tentang formalisme DAG.

— Alexis

Jawaban saya mungkin tidak terlalu persuasif, tetapi semoga orang lain dapat melakukan pekerjaan yang lebih baik. Model yang Anda tulis adalah SEM linier, jadi meskipun Anda tidak secara khusus bertanya tentangnya, jika Anda mencoba menghubungkan beberapa jenis diagram lintasan dengan istilah dalam model, Anda berkelana ke wilayah diagram lintasan SEM.

— Nuh