Residu Pearson


16

Pertanyaan seorang pemula tentang residu Pearson dalam konteks uji chi-square untuk kebaikan:

Serta statistik uji, R's chisq.test fungsi melaporkan residu Pearson:

(obs - exp) / sqrt(exp)

Saya mengerti mengapa melihat perbedaan mentah antara nilai yang diamati dan yang diharapkan tidak informatif, karena sampel yang lebih kecil akan menghasilkan perbedaan yang lebih kecil. Namun, saya ingin tahu lebih banyak tentang efek penyebut: mengapa membagi dengan akar dari nilai yang diharapkan? Apakah ini residu 'standar'?


6
Penyebut digunakan untuk menjelaskan varians residu mentah yang kemudian membuat residu Pearson kira-kira varians unit (ada metode lain untuk mencapai ini). Harap dicatat bahwa ada komponen stdresuntuk residu standar.
chl

@chl Terima kasih atas tanggapan cepat Anda. Namun, saya tidak mengerti konsep varians dalam konteks ini. Apakah Anda tahu sumber daya di mana saya bisa belajar lebih banyak? Saya berasumsi, kemudian, bahwa residu Pearson tidak 'standar', mengingat itu chisq.testjuga menghitung stdreskomponen?
Iain Dillingham

3
Referensi definitif untuk analisis data kategorikal mungkin adalah Analisis Data Kategorikal , oleh Alan Agresti. Jika tidak ada yang memberikan jawaban yang lebih terperinci, saya akan mencoba mengubah komentar saya menjadi jawaban yang tepat.
chl

Terima kasih atas tautannya, @chl. Saya sudah memiliki akses ke buku itu, jadi saya akan mencoba mencari yang ini sendiri.
Iain Dillingham

Jawaban:


10

n×m

Xsaya,j ~ Pois(μsaya,j)

E(Xsaya,j)=V(Xsaya,j)=μsaya,j

STD(Xsaya,j)Xsaya,j-E(Xsaya,j)V(Xsaya,j)=Xsaya,j-μsaya,jμsaya,j

Jadi, apa yang Anda lihat dalam rumus yang Anda tanyakan adalah jumlah sel terstandarisasi, dengan asumsi bahwa jumlah sel memiliki distribusi Poisson (tanpa syarat).

Dari sini adalah umum untuk menguji independensi variabel baris dan kolom dalam data, dan dalam hal ini Anda dapat menggunakan statistik uji yang terlihat pada jumlah kuadrat dari nilai-nilai di atas (yang setara dengan norma kuadrat) dari vektor nilai standar). Uji chi-squared memberikan nilai-p untuk jenis tes ini berdasarkan pada perkiraan sampel besar untuk distribusi nol dari statistik uji. Ini biasanya diterapkan dalam kasus di mana tidak ada jumlah penjualan yang terlalu kecil.


0

Dalam konteks goodness of fit, Anda dapat merujuk ke http://www.stat.yale.edu/Courses/1997-98/101/chigf.htm ini .

Jika Anda ingin tahu bagaimana penyebutnya sampai di sana, Anda harus melihat chi-squared di sini sebagai perkiraan normal untuk binomial, sebagai permulaan, yang kemudian dapat diperluas ke multinomial.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.