Untuk menjawab pertanyaan literal Anda, "Apakah valid untuk memasukkan ukuran dasar sebagai variabel kontrol ketika menguji pengaruh variabel independen pada skor perubahan?", Jawabannya adalah tidak . Jawabannya adalah tidak, karena dengan konstruksi skor baseline berkorelasi dengan istilah kesalahan ketika skor perubahan digunakan sebagai variabel dependen, maka efek estimasi baseline terhadap skor perubahan tidak dapat diinterpretasikan.
Menggunakan
- Y1 sebagai bobot awal
- Y2 sebagai bobot akhir
- Δ Y = Y 2 - Y 1Δ Y sebagai perubahan berat (yaitu )Δ Y= Y2- Y1
- T sebagai pengobatan yang ditugaskan secara acak , dan
- X sebagai faktor eksogen lain yang mempengaruhi berat badan (misalnya variabel kontrol lain yang terkait dengan hasil tetapi harus tidak berkorelasi dengan pengobatan karena penugasan acak)
Satu kemudian memiliki model regresi pada dan ; T XΔ YTX
Δ Y= β1T+ β2X+ e
Yang menurut definisi setara dengan;
Y2- Y1= β1T+ β2X+ e
Sekarang, jika Anda memasukkan garis dasar sebagai kovariat, orang akan melihat masalah, karena Anda memiliki istilah di kedua sisi persamaan. Ini menunjukkan bahwa tidak dapat diinterpretasikan, karena secara inheren berkorelasi dengan istilah kesalahan.β 3 Y 1Y1β3Y1
Y2- Y1Y2= β1T+ β2X+ β3Y1+ e= β1T+ β2X+ β3Y1+ ( e + Y1)
Sekarang, bagian dari kebingungan dalam berbagai jawaban tampaknya berasal dari kenyataan bahwa model yang berbeda akan menghasilkan hasil yang identik untuk efek pengobatan , dalam formulasi saya di atas. Jadi, jika seseorang membandingkan efek pengobatan untuk model menggunakan skor perubahan sebagai variabel dependen dengan model menggunakan "level" (dengan masing-masing model termasuk garis dasar sebagai kovariat), interpretasi dari efek pengobatan akan menjadi sama. Dalam dua model yang mengikuti akan sama, demikian juga kesimpulan berdasarkan pada mereka (Bruce Weaver memiliki beberapa kode SPSS yang diposting menunjukkan kesetaraan juga).Y 1 β 1 Tβ1TY1β1T
Ch a n ge Score ModelLevels Model:Y2−Y1=β1T+β2X+β3Y1+e:Y2=β1T+β2X+β3Y1+e
Jadi beberapa akan berdebat (seperti yang Felix miliki di utas ini, dan seperti yang dilakukan Bruce Weaver pada beberapa diskusi di grup SPSS google) bahwa karena model menghasilkan perkiraan efek pengobatan yang sama, tidak masalah yang mana yang Anda pilih. Saya tidak setuju, karena kovariat awal dalam model skor perubahan tidak dapat diartikan, Anda tidak boleh memasukkan baseline sebagai kovariat (terlepas dari apakah efek pengobatan yang diperkirakan sama atau tidak). Jadi ini memunculkan pertanyaan lain, apa gunanya menggunakan skor perubahan sebagai variabel dependen? Seperti yang telah dicatat Felix juga, model yang menggunakan skor perubahan sebagai variabel dependen tidak termasuk baseline sebagai kovariat berbeda dari model yang menggunakan level. Untuk memperjelas, model-model selanjutnya akan memberikan efek pengobatan yang berbeda (terutama dalam kasus bahwa perawatan berkorelasi dengan baseline);
Ch a n ge S c o r e M o de l W i t h o u t B a s e l i n e L e v e l s M o de l:Y2−Y1=β1T+β2X+e:Y2=β1T+β2X+β3Y1+e
Ini telah dicatat dalam literatur sebelumnya sebagai "Paradox Tuhan". Jadi model mana yang benar? Nah, dalam kasus percobaan acak, saya akan mengatakan model Levels lebih disukai (meskipun jika Anda melakukan pekerjaan acak yang baik, efek pengobatan rata-rata harus sangat dekat antara model). Yang lain telah mencatat alasan mengapa model level lebih disukai, jawaban Charlie membuat poin yang bagus karena Anda dapat memperkirakan efek interaksi dengan baseline dalam model level (tetapi Anda tidak bisa dalam model skor perubahan). Whuber dalam respons ini untuk pertanyaan yang sangat mirip menunjukkan bagaimana skor perubahan menginduksi korelasi antara perawatan yang berbeda.
Dalam situasi di mana perawatan tidak diberikan secara acak, model yang menggunakan skor perubahan sebagai variabel dependen harus lebih dipertimbangkan. Manfaat utama dari model skor perubahan, adalah bahwa setiap prediktor invarian hasil dikendalikan untuk. Jadi katakanlah dalam formulasi di atas, adalah konstan sepanjang waktu (misalnya mengatakan kecenderungan genetik berada pada berat tertentu), dan bahwa berkorelasi dengan apakah seseorang memilih untuk berolahraga (dan tidak diobservasi). Dalam hal itu, model skor perubahan lebih disukai. Juga dalam kasus di mana pemilihan ke dalam pengobatan berkorelasi dengan nilai awal, model skor perubahan mungkin lebih disukai. Paul Allison dalam makalahnya,X XXXXUbah Skor sebagai Variabel Dependen dalam Analisis Regresi , memberikan contoh yang sama (dan sebagian besar memengaruhi perspektif saya tentang topik tersebut, jadi saya sangat menyarankan untuk membacanya).
Ini bukan untuk mengatakan bahwa skor perubahan selalu lebih baik di pengaturan non-acak. Dalam hal Anda mengharapkan baseline memiliki efek kausal yang sebenarnya pada berat post, Anda harus menggunakan model level. Dalam hal Anda mengharapkan garis dasar memiliki efek kausal, dan pemilihan ke dalam pengobatan berkorelasi dengan garis dasar, efek pengobatan dikacaukan dengan efek garis dasar.
Saya telah mengabaikan catatan oleh Charlie bahwa logaritma bobot dapat digunakan sebagai variabel dependen. Meskipun saya tidak ragu itu bisa menjadi kemungkinan, ini agak tidak berurutan untuk pertanyaan awal. Pertanyaan lain telah dibahas ketika layak untuk menggunakan logaritma variabel (dan mereka masih berlaku dalam kasus ini). Mungkin ada literatur sebelumnya tentang subjek yang akan membantu memandu Anda apakah menggunakan berat badan yang masuk juga tepat.
Kutipan
Allison, Paul D. 1990. Ubah skor sebagai variabel dependen dalam analisis regresi . Metodologi Sosiologis 20: 93-114. Versi PDF publik .