Menafsirkan kemungkinan log


9

Saya mengalami kesulitan menafsirkan beberapa hasil. Saya sedang melakukan regresi terkait hirarkis dengan ecoreg. Jika saya memasukkan kode saya menerima output dengan rasio odds, rasio kepercayaan dan kemungkinan log 2x dimaksimalkan.

Namun, saya tidak sepenuhnya mengerti bagaimana menafsirkan kemungkinan log maksimal 2x. Sejauh yang saya tahu log likelihood digunakan sebagai cara yang nyaman untuk menghitung kemungkinan dan menghitung nilai parameter berdasarkan hasil. Tetapi saya tidak mengerti apakah nilai yang lebih tinggi atau lebih rendah lebih baik. Saya melihat beberapa sumber online misalnya /programming/2343093/what-is-log-likelihood , tapi saya masih buntu.

Di bawah hasil yang saya terima:

Call:
eco(formula = cbind(y, N) ~ deprivation + meanIncome, binary = ~fracSmoke + 
    soclass, data = dfAggPlus, cross = cross)

Aggregate-level odds ratios: 
                   OR        l95        u95
(Intercept) 0.0510475 0.03837276 0.06790878
deprivation 0.9859936 0.88421991 1.09948134
meanIncome  1.0689951 0.95574925 1.19565924

Individual-level odds ratios:
                OR       l95      u95
fracSmoke 3.124053 2.0761956 4.700765
soclass   1.001050 0.9930815 1.009083

-2 x log-likelihood:  237.4882 

Jadi, bagaimana saya harus menafsirkan nilai 237,4882 dibandingkan dengan hasil 206 atau 1083? Bantuan sangat dihargai!


Apa yang sebenarnya tidak jelas untuk Anda?
Tim

Yah, saya ingin mengerti apakah kemungkinan log yang lebih tinggi berarti hasilnya lebih dapat diandalkan atau misalnya kurang dapat diandalkan. Lebih lanjut saya ingin tahu bagaimana saya harus menafsirkan perbedaan antara beberapa hasil (misalnya 206 237 atau 1083)
Keizer


Saya menandai pertanyaan Anda sebagai duplikat dari pertanyaan lain yang lebih umum, yang menanyakan apa estimasi kemungkinan maksimum - periksa.
Tim

Sepertinya itu digunakan sebagai penyimpangan. Lihat < en.wikipedia.org/wiki/Deviance_information_criterion >
pglpm

Jawaban:


0

Untuk mendapatkan setidaknya beberapa makna dari kemungkinan L, Anda bisa ingat bahwa untuk memperbaiki jumlah sampel N, kemungkinan log maksimum untuk model distribusi tertentu terutama tergantung pada skala. Untuk varian yang diberikan, distribusi normal memiliki nilai tertinggi. Untuk mendapatkan beberapa wawasan saya akan membagi logL dengan N, dan kemudian mungkin juga melakukan koreksi untuk skala. Jika data Anda lebih cocok untuk distribusi seragam, maka akan lebih baik menggunakan kemungkinan seragam sebagai fungsi entropi maksimum untuk rentang yang diberikan sebagai jenis referensi. Nilai referensi umum lainnya mungkin untuk kasus kontinu untuk menggunakan kecocokan KDE, dan untuk menghitung L untuk ini. Namun, apa pun yang Anda lakukan, L lebih sulit untuk ditafsirkan daripada misalnya nilai KS atau kesalahan rms.
Jika Anda mengambil model lain dan mendapatkan L yang lebih tinggi, maka itu tidak berarti model itu lebih baik, karena mungkin Anda berada dalam situasi overfitting. Untuk memasukkan ini gunakan nilai AIC. Di sini lebih rendah lebih baik, dan sekali lagi Anda dapat menggunakan distribusi normal sebagai "referensi".

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.