Deviance vs Pearson, demi kebaikan


8

Saya mencoba untuk membuat model dengan menggunakan regresi binomial negatif (GLM binomial negatif). Saya memiliki ukuran sampel yang relatif kecil (lebih dari 300), dan data tidak diskalakan. Saya perhatikan bahwa ada dua cara untuk mengukur good of fit - satu penyimpangan dan yang lainnya adalah statistik Pearson. Bagaimana saya bisa menentukan ukuran barang yang cocok untuk digunakan? Apakah ada beberapa kriteria yang dapat saya perhatikan dalam memilih ukuran good-of-fit?


Saya tidak yakin apa yang Anda maksud dengan "Saya memiliki ukuran sampel yang relatif kecil (lebih dari 300)".
Dason

@ Alasan 300 bukan jumlah yang sangat besar dalam ekspresi gen seperti
HelloWorld

Jawaban:


10

Tes good-of-fit berdasarkan penyimpangan adalah tes kemungkinan-rasio antara model pas & yang jenuh (satu di mana setiap pengamatan mendapatkan parameter sendiri). Tes Pearson adalah tes skor; nilai yang diharapkan dari skor (turunan pertama dari fungsi log-likelihood) adalah nol jika model yang cocok benar, & Anda mengambil perbedaan yang lebih besar dari nol sebagai bukti kuat dari kurangnya kecocokan. Teori ini dibahas dalam Smyth (2003), "Goodness of fit statistik Pearson sebagai statistik uji skor", Statistik dan sains: Festschrift for Terry Speed .

Dalam praktiknya, orang biasanya mengandalkan perkiraan asimtotik dari keduanya untuk distribusi chi-kuadrat - untuk model binomial negatif ini berarti jumlah yang diharapkan tidak boleh terlalu kecil. Smyth mencatat bahwa uji Pearson lebih kuat terhadap kesalahan spesifikasi model, karena Anda hanya menganggap model yang dipasang sebagai nol tanpa harus mengambil bentuk tertentu untuk model jenuh. Saya tidak pernah melihat banyak perbedaan di antara mereka.

Anda mungkin ingin mencerminkan bahwa kurangnya kecocokan dengan salah satu dari Anda memberi tahu Anda apa yang mungkin sudah Anda ketahui: bahwa model Anda bukan representasi realitas yang sempurna. Anda cenderung diberi tahu ini semakin besar ukuran sampel Anda. Mungkin pertanyaan yang lebih tepat adalah apakah Anda dapat meningkatkan model Anda, & apa metode diagnostik yang dapat membantu Anda.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.