Apakah secara teknis “valid” sesuai dengan regresi logistik dengan variabel dependen yang proporsional?


8

Beberapa posting (di sini dan di sini ) menunjukkan bahwa regresi beta lebih tepat ketika variabel dependen secara alami dibatasi antara 0 dan 1. Pertanyaan saya adalah, mengesampingkan kesesuaian, apakah secara teknis tidak tepat untuk memasukkan regresi logistik ke variabel respons proporsional? R akan memberikan peringatan tetapi masih membuahkan hasil.

Sepertinya saya bahwa fungsi kemungkinan tidak akan menjadi kemungkinan yang valid ketika variabel respon proporsional bukan biner, tetapi secara matematis, masih dapat diminimalkan untuk memberikan solusi. Saya bertanya-tanya pelanggaran / kesalahan apa, jika ada, yang dilakukan ketika menyesuaikan regresi logistik ke data proporsional.


Selain jawaban di bawah ini: Ini adalah pos lain yang berhubungan dengan pertanyaan ini.
COOLSerdash

Jawaban:


8

Apa yang Anda usulkan kadang-kadang disebut log fraksional. Ini tentu memiliki kelebihan, asalkan Anda ingat untuk menggunakan kesalahan standar yang kuat. Pada tahun 2010 saya memberikan ceramah di pertemuan Pengguna Stata Jerman membandingkan antara lain regresi beta dan logit fraksional. Slide dapat ditemukan di sini: http://www.maartenbuis.nl/presentations/berlin10.pdf


(+1) Maarten, pertanyaan lain: Saya membaca bahwa binomial GLM dapat digunakan untuk respons fraksi / proporsi jika jumlah uji coba disediakan untuk setiap fraksi / proporsi (dalam R ini dilakukan dengan weightsargumen untuk glm), lihat misalnya di sini stats.stackexchange.com/a/26779/28666 . Bagaimana "log fraksional" dengan "kesalahan standar yang kuat" berhubungan dengan pendekatan ini? Apakah sama atau tidak?
amoeba

2
@amoeba berbeda. Pikirkan log fraksional sebagai model untuk proporsi rata-rata, sedangkan apa yang Anda usulkan sebagai cara untuk memulihkan model logit.
Maarten Buis

6

Model semacam ini sering didefinisikan dan digunakan sebagai salah satu jenis model linier umum. Untuk satu ulasan ringkas, lihat http://www.stata-journal.com/article.html?article=st0147 Argumennya adalah bahwa binomial adalah keluarga yang masuk akal bahkan untuk proporsi terus menerus karena varians juga akan mendekati 0 sebagai pendekatan rata-rata 0 atau 1.

Apakah program atau fungsi tertentu dalam perangkat lunak tertentu mengakomodasi mereka adalah masalah yang berbeda. Untuk mengatakan bahwa "R akan memberikan peringatan tetapi masih membuahkan hasil" menyampaikan sedikit informasi. Paket mana yang Anda maksud? Apakah ini satu-satunya paket yang relevan? Dalam kasus apa pun, seperti yang ditunjukkan oleh artikel yang dirujuk, model ini didukung dengan baik di Stata, misalnya.

Itu masih menyisakan ruang untuk diskusi rinci tentang manfaat relatif dari model logit untuk proporsi berkelanjutan dan regresi beta.


1
Memberi +1 pada jawaban lama ini setelah diskusi hari ini di tempat lain. Saya masih mendorong Anda untuk mengirim jawaban tentang pendekatan ini di stats.stackexchange.com/questions/29038 .
amoeba

1
Beberapa komentar tentang cara kerjanya di R misalnya dalam komentar di bawah stats.stackexchange.com/a/43369 jawaban ini di utas terkait.
amoeba
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.