Menafsirkan output regresi logistik di R


13

Aku sedang bekerja pada sebuah regresi logistik ganda di R menggunakan glm. Variabel prediktor bersifat kontinu dan kategorikal. Ekstrak ringkasan model menunjukkan hal berikut:

Coefficients:
               Estimate Std. Error z value Pr(>|z|)
(Intercept)   2.451e+00  2.439e+00   1.005   0.3150
Age           5.747e-02  3.466e-02   1.658   0.0973 .
BMI          -7.750e-02  7.090e-02  -1.093   0.2743
...
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Interval kepercayaan:

                  2.5 %       97.5 %
(Intercept)  0.10969506 1.863217e+03
Age          0.99565783 1.142627e+00
BMI          0.80089276 1.064256e+00
...

Rasio ganjil:

                 Estimate Std. Error   z value Pr(>|z|)
(Intercept)  1.159642e+01  11.464683 2.7310435 1.370327
Age          1.059155e+00   1.035269 5.2491658 1.102195
B            9.254228e-01   1.073477 0.3351730 1.315670
...

Output pertama menunjukkan bahwa signifikan. Namun, interval kepercayaan untuk mencakup nilai 1 dan rasio odds untuk sangat dekat dengan 1. Apa artinya nilai p yang signifikan dari output pertama artinya? Apakah merupakan prediktor hasil atau tidak?A g e A g e A g eAgeAgeAgeAge


8
Ini hanya signifikan pada tingkat kepercayaan 10%, tetapi interval kepercayaan 5%.
Nick Sabbe

Jadi interval kepercayaan untuk 10% tidak termasuk 1 kalau begitu?
SabreWolfy

Nilai-p (tabel pertama kolom terakhir) adalah peluang bahwa hasil yang diperoleh atau lebih buruk akan tercapai jika hipotesis nol itu benar. Interval kepercayaan adalah a / wilayah yang akan memegang nilai sebenarnya dalam misalnya 95% dari waktu. Jika tidak memiliki nilai sebenarnya yang dihipotesiskan, maka paling tidak ada peluang 5% bahwa kita akan mendapatkan hasil yang diperoleh atau lebih buruk, jika hipotesis itu benar. Jadi ini akan menyiratkan nilai p Anda lebih rendah dari 5%. Ada hubungan yang sangat erat antara nilai-p dan interval kepercayaan (statistik 101). Tetapi singkatnya: ya, CI untuk 10% akan termasuk 1.
Nick Sabbe

Tampaknya Anda mengasumsikan linearitas. Bagaimana itu dibenarkan?
Frank Harrell

Jawaban:


8

Ada sejumlah pertanyaan di sini di situs yang akan membantu dengan interpretasi output model (di sini adalah tiga contoh berbeda, 1 2 3 , dan saya yakin ada lebih banyak jika Anda menggali melalui arsip). Berikut ini juga tutorial di situs web statistik UCLA tentang cara menafsirkan koefisien untuk regresi logistik.

Meskipun odds-ratio untuk koefisien usia mendekati satu, itu tidak selalu berarti efeknya kecil (apakah efeknya kecil atau besar sering kali merupakan pertanyaan normatif seperti halnya yang empiris). Orang perlu mengetahui variasi tipikal usia antara pengamatan untuk membuat pendapat yang lebih terinformasi.


Terima kasih atas tautan ke tutorialnya, yang terlihat komprehensif. Saya melakukan pencarian di sini sebelum memposting pertanyaan saya. Tautan 1 dan 3 tampaknya tidak terkait dengan pertanyaan saya.
SabreWolfy

@ SabreWolfy, tautan 1 lebih lanjut menjelaskan bagaimana menafsirkan koefisien dalam hal unit asli, tautan 3 menjelaskan langkah-langkah untuk menafsirkan efek dalam hal probabilitas (yang benar-benar berlaku untuk pertanyaan Anda, dan plot yang disarankan dalam pertanyaan itu adalah tanggapan yang masuk akal bagi saya mengatakan ukuran efek langsung sulit untuk diinterpretasikan tanpa mengetahui variasi usia).
Andy W

5
(1.059301)×100%=458%

Tautan UCLA sudah mati, tetapi yang ini mungkin sesuai (setidaknya kontennya membantu saya memahami pertanyaan ini).
MBR
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.