Situasi saya adalah:
Saya memiliki 1 variabel dependen kontinu dan 1 kontinu yang telah saya ubah secara logaritma untuk menormalkan residu mereka untuk regresi linier sederhana.
Saya akan menghargai bantuan apa pun tentang bagaimana saya bisa menghubungkan variabel-variabel yang diubah ini dengan konteks aslinya.
Saya ingin menggunakan regresi linier untuk memprediksi jumlah hari siswa tidak masuk sekolah pada tahun 2011 berdasarkan jumlah hari yang mereka lewatkan pada tahun 2010. Kebanyakan siswa ketinggalan 0 hari atau hanya beberapa hari data miring positif ke kiri. Oleh karena itu, diperlukan transformasi untuk menggunakan regresi linier.
Saya telah menggunakan log10 (var + 1) untuk kedua variabel (saya menggunakan +1 untuk siswa yang telah melewatkan 0 hari sekolah). Saya menggunakan regresi karena saya ingin menambahkan faktor kategori - jenis kelamin / etnis dll juga.
Masalah saya adalah:
Audiens yang ingin saya beri umpan balik tidak akan mengerti log10 (y) = log (konstan) + log (var2) x (dan terus terang saya juga tidak).
Pertanyaan saya adalah:
a) Apakah ada cara yang lebih baik untuk menafsirkan variabel yang berubah dalam regresi? Yaitu selama 1 hari tidak terjawab pada tahun 2010 mereka akan kehilangan 2 hari pada tahun 2011 sebagai lawan dari perubahan 1 unit log pada tahun 2010 akan ada perubahan unit log x pada tahun 2011?
b) Secara khusus, diberikan kutipan kutipan dari sumber ini sebagai berikut:
"Ini adalah estimasi regresi binomial negatif untuk peningkatan satu unit dalam nilai tes standar matematika, mengingat variabel lain tetap konstan dalam model. Jika seorang siswa meningkatkan skor tes matematika dengan satu poin, perbedaan dalam log dari jumlah yang diharapkan akan diperkirakan menurun sebesar 0,0016 unit, sambil memegang variabel lain dalam model konstan. "
Saya ingin tahu:
- Apakah bacaan ini mengatakan bahwa untuk setiap kenaikan satu satuan dalam skor
UNTRANSFORMED
variabel matematika mengarah ke penurunan 0,0016 dari konstanta (a), jadi jikaUNTRANSFORMED
skor matematika naik dua poin, saya kurangi 0,0016 * 2 dari konstanta a? - Apakah itu berarti bahwa saya mendapatkan mean geometrik dengan menggunakan eksponensial (a)) dan eksponensial (a + beta * 2) dan, bahwa saya perlu menghitung perbedaan persentase antara keduanya untuk mengatakan apa pengaruh variabel prediktor memiliki / miliki pada variabel dependen?
- Atau salah saya?
Saya menggunakan SPSS v20. Maaf karena membingkai ini dalam pertanyaan panjang.
R
memiliki paket untuk model nol-inflasi; cari situs ini .)