Ini kelihatannya sangat mendasar, tetapi saya selalu terjebak pada titik ini ...
Sebagian besar data yang saya tangani tidak normal, dan sebagian besar analisis didasarkan pada struktur GLM. Untuk analisis saya saat ini, saya memiliki variabel respons yaitu "kecepatan berjalan" (meter / menit). Mudah bagi saya untuk mengidentifikasi bahwa saya tidak dapat menggunakan OLS, tetapi kemudian, saya memiliki ketidakpastian besar dalam memutuskan keluarga apa (Gamma, Weibull, dll.) Yang tepat!
Saya menggunakan Stata dan melihat diagnostik seperti residual dan heteroskedastisitas, residual vs nilai yang dipasang, dll.
Saya menyadari bahwa data penghitungan dapat mengambil bentuk tingkat (misalnya tingkat kejadian) dan telah menggunakan gamma (analog untuk model binomial negatif diskrit berlebih), tetapi hanya ingin "pistol merokok" untuk mengatakan YA, ANDA MEMILIKI HAK KELUARGA. Apakah hanya melihat residu terstandarisasi versus nilai-nilai yang dipasang adalah satu-satunya cara terbaik untuk melakukan ini? Saya ingin menggunakan model campuran untuk memperhitungkan beberapa hierarki dalam data juga, tetapi pertama-tama perlu memilah keluarga yang paling menggambarkan variabel respon saya.
Setiap bantuan dihargai. Bahasa stata sangat dihargai!