Saya punya beberapa pertanyaan tentang menafsirkan rasio odds untuk variabel kontinu dalam regresi logistik. Saya merasa seperti ini adalah pertanyaan dasar tentang regresi logistik (dan mungkin tentang regresi secara umum), dan meskipun saya sedikit malu bahwa saya tidak tahu jawabannya, saya akan menelan harga diri saya dan bertanya sehingga saya tahu mereka di masa depan!
Inilah situasi saya ... Saya sedang melihat sampel pemuda yang diadili yang, sebagai bagian dari masa percobaan mereka, terdaftar dalam program pelatihan keterampilan kerja / hidup. Saya ingin melihat sejauh mana usia mereka dilepaskan dari program memperkirakan pekerjaan enam bulan setelah rilis dari program.
(Juga, perlu diingat bahwa ada prediktor lain dalam model, tetapi saya telah mengecualikannya karena mereka tidak signifikan secara statistik dan saya ingin menjaga ini sejelas mungkin.)
Predictor: Usia pelepasan dari program pelatihan (Usia rata-rata = 17,4, SD = 1.2, Rentang 14.3-20.5)
Hasil: Dipekerjakan atau tidak (Dipekerjakan = 1, Tidak Dipekerjakan = 0)
Hasil: Odds ratio 3.01 (p <.005) (Saya sudah mengecualikan statistik goodness of fit, dll. Karena saya mencari jawaban tentang interpretasi rasio odds saja; saya merasa nyaman dengan evaluasi model fit, CI's , dll.)
Dengan kata lain: Seiring bertambahnya usia satu tahun, kemungkinan dipekerjakan enam bulan pasca-pemutusan meningkat tiga unit.
Pertanyaan:
1) Ketika saya mengatakan, "Seiring bertambahnya usia satu tahun ..." apa titik awal untuk usia?
Apakah usia mulai nol? Misalnya, "Seiring bertambahnya usia dari 0 [yaitu, usia terendah jika Anda menempatkan model ini pada grafik] ..."
Apakah usia dimulai pada usia terendah di antara rentang usia dalam sampel? Misalnya, "Seiring bertambahnya usia dari 14,3 ..."
ATAU
Apakah usia dimulai pada usia rata-rata sampel? Misalnya, "Seiring bertambahnya usia dari 17,4 ...",
2) Apakah pemusatan membantu saya menafsirkan hasil ini ATAU apakah hanya efektif dalam menafsirkan y-int? Jika itu akan membantu, saya berpikir untuk melakukan pemusatan berarti atau mengurangi usia terendah dalam kisaran dari semua usia lainnya dalam sampel. Ada saran?
3) Akhirnya, apakah pantas untuk mengatakan bahwa dibandingkan dengan seorang pemuda berusia 14 tahun, seorang pemuda berusia 17 tahun sembilan kali lebih mungkin dipekerjakan? Saya bertanya karena saya tahu bahwa regresi logistik mengasumsikan hubungan sigmoidal, dan saya ingin tahu apakah peningkatan 3 unit dalam odds ini tetap konsisten pada titik mana pun di sepanjang garis regresi.
Terima kasih banyak!
Harun