Baru-baru ini, saya tertarik untuk mengimplementasikan model regresi beta, untuk hasil yang proporsional. Perhatikan bahwa hasil ini tidak akan masuk ke dalam konteks binomial, karena tidak ada konsep yang bermakna dari "kesuksesan" diskrit dalam konteks ini. Bahkan, hasilnya sebenarnya adalah proporsi durasi; pembilang menjadi jumlah detik saat kondisi tertentu aktif di atas jumlah total detik selama kondisi tersebut memenuhi syarat untuk aktif. Saya minta maaf atas masalah ini, tetapi saya tidak ingin terlalu fokus pada konteks yang tepat ini, karena saya menyadari ada berbagai cara proses semacam itu dapat dimodelkan selain regresi beta, dan untuk saat ini saya lebih tertarik secara khusus dalam teori pertanyaan yang muncul dalam upaya saya untuk menerapkan model seperti itu (meskipun saya, tentu saja,
Bagaimanapun, semua sumber daya yang saya dapat temukan telah mengindikasikan bahwa regresi beta biasanya cocok menggunakan tautan logit (atau probit / cloglog), dan parameter yang ditafsirkan sebagai perubahan dalam peluang log. Namun, saya belum menemukan referensi yang benar-benar memberikan justifikasi nyata mengapa seseorang ingin menggunakan tautan ini.
Kertas asli Ferrari & Cribari-Neto (2004) tidak memberikan pembenaran; mereka hanya mencatat bahwa fungsi logit adalah "sangat berguna", karena interpretasi rasio odds dari parameter eksponensial. Sumber-sumber lain menyinggung keinginan untuk memetakan dari interval (0,1) ke garis nyata. Namun, apakah kita perlu fungsi tautan untuk pemetaan seperti itu, mengingat kita sudah mengasumsikan distribusi beta? Apa manfaat yang disediakan fungsi tautan di atas dan di luar batasan yang dipaksakan dengan mengasumsikan distribusi beta sebagai permulaan?Saya telah menjalankan beberapa simulasi cepat dan belum melihat prediksi di luar interval (0,1) dengan tautan identitas, bahkan ketika mensimulasikan dari distribusi beta yang massa probabilitasnya sebagian besar dikelompokkan mendekati 0 atau 1, tetapi mungkin simulasi saya belum cukup umum untuk menangkap beberapa patologi.
Bagiku berdasarkan pada bagaimana individu, dalam praktiknya, menginterpretasikan estimasi parameter dari model regresi beta (yaitu sebagai rasio odds) bahwa mereka secara implisit membuat kesimpulan sehubungan dengan peluang "kesuksesan"; yaitu, mereka menggunakan regresi beta sebagai pengganti model binomial. Mungkin ini sesuai dalam beberapa konteks, mengingat hubungan antara distribusi beta dan binomial, tetapi bagi saya tampaknya ini lebih merupakan kasus khusus daripada yang umum. Dalam pertanyaan ini , sebuah jawaban diberikan untuk menafsirkan rasio odds sehubungan dengan proporsi berkelanjutan daripada hasilnya, tetapi bagi saya tampaknya tidak rumit untuk mencoba dan menafsirkan hal-hal dengan cara ini, yang bertentangan dengan menggunakan, katakanlah, log atau tautan identitas dan menafsirkan% perubahan atau pergeseran unit.
Jadi, mengapa kita menggunakan tautan logit untuk model regresi beta? Apakah ini hanya untuk kenyamanan, untuk menghubungkannya dengan model binomial?