Menafsirkan plot diagnostik residual untuk model GLM?


33

Saya mencari pedoman tentang cara menafsirkan plot residual model GLM. Terutama poisson, binomial negatif, model binomial. Apa yang bisa kita harapkan dari plot ini ketika modelnya "benar"? (misalnya, kami berharap varians akan tumbuh dengan meningkatnya nilai yang diprediksi, ketika berurusan dengan model Poisson)

Saya tahu jawabannya tergantung pada model. Referensi apa pun (atau poin umum untuk dipertimbangkan) akan sangat membantu / dihargai.

Jawaban:


16

Saya pikir ini adalah salah satu bagian yang paling menantang ketika melakukan analisis regresi. Saya juga berjuang dengan sebagian besar interpretasi (khususnya diagnostik binomial gila!).

Saya baru saja menemukan posting ini http://www.r-bloggers.com/model-validation-interpreting-residual-plots/ yang juga menautkan http://statmaster.sdu.dk/courses/st111/module04/index.html # SECTION0002000000000000000000

apa yang paling membantu saya adalah untuk merencanakan residual versus setiap parameter prediksi termasuk DAN tidak termasuk ke dalam model. Ini juga berarti orang-orang yang dijatuhkan sebelumnya karena alasan multikolinearitas. Untuk plot kotak ini, plot sebaran kondisional dan plot sebaran normal sangat bagus. ini membantu untuk menemukan kemungkinan kesalahan

Dalam "Forest Analytics with R" (UseR Series) ada beberapa penjelasan yang baik bagaimana menafsirkan residu untuk model efek campuran (dan juga glm). Bagus dibaca! http://www.springer.com/statistics/life+sciences,+medicine+%26+health/book/978-1-4419-7761-8

Suatu hari yang lalu saya memikirkan sebuah situs web yang dapat mengumpulkan pola residual yang dapat dipilih pengguna sebagai "ok" dan "tidak ok". tapi saya tidak pernah menemukan situs web itu;)


8

Saya akan menyarankan metode yang dijelaskan dalam:

 Buja, A., Cook, D. Hofmann, H., Lawrence, M. Lee, E.-K., Swayne,
 D.F and Wickham, H. (2009) Statistical Inference for exploratory
 data analysis and model diagnostics Phil. Trans. R. Soc. A 2009
 367, 4361-4383 doi: 10.1098/rsta.2009.0120

Ada beberapa ide berbeda, tetapi sebagian besar datang ke simulasi data di mana Anda tahu apa hubungan yang sebenarnya dan hubungan itu didasarkan pada analisis Anda terhadap data nyata. Kemudian Anda membandingkan diagnostik dari data asli Anda dengan diagnostik set data yang disimulasikan. The vis.testfungsi dalam paket TeachingDemos untuk R menerapkan variasi dari 1 saran di koran. Baca seluruh makalah (bukan hanya ringkasan singkat saya) untuk pemahaman yang lebih baik.


Saya pikir itu adalah saran yang bagus untuk melihat pola yang menyimpang dari acak di sebar atau plot lainnya, tetapi itu bukan satu-satunya tujuan ketika melihat residu. Seringkali kami tertarik pada penyimpangan tertentu dari acak (misalnya, hetereoscedasticity, non-linearity yang salah ditentukan dalam model, variabel yang dihilangkan, outlier atau nilai leverage yang tinggi, dll.). Perbandingan dengan data yang dibuat secara acak tidak benar-benar membantu dalam mengidentifikasi mengapa residu tidak acak atau obat.
Andy W

@AndyW, saya pikir kami menafsirkan pertanyaan asli secara berbeda. Jawaban saya membuat peneliti memulai dengan memberi tahu mereka jika ada sesuatu yang perlu mereka cari, atau jika plot residualnya masuk akal. Apa yang harus dilakukan jika tidak terlihat masuk akal adalah langkah selanjutnya dan di luar jawaban saya (meskipun beberapa asumsi tambahan dapat dibandingkan dengan menggunakan serangkaian simulasi baru).
Greg Snow

5

Pertanyaan ini cukup lama, tetapi saya pikir akan berguna untuk menambahkan bahwa, karena baru-baru ini, Anda dapat menggunakan paket DHARMa R untuk mengubah residu dari setiap GL (M) M menjadi ruang standar. Setelah ini dilakukan, Anda dapat menilai / menguji masalah residual secara visual seperti penyimpangan dari distribusi, ketergantungan residual pada prediktor, heteroskedastisitas, atau autokorelasi dengan cara normal. Lihat sketsa paket untuk contoh yang dikerjakan, juga pertanyaan lain tentang CV di sini dan di sini .

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.