Uji goodness-of-fit menggunakan statistik berikut : χ 2 0 = n ∑ i = 1 ( O i - E i ) 2 Dalam tes, pemberian bahwa kondisi terpenuhi, salah satu kegunaan yangχ2-distribusiuntuk menghitung p-value yang diberikanH0benar salah satu akan mengamati nilai tersebut dalam sampel yang representatif dengan ukuran yang sama.
Namun, dalam rangka untuk statistik untuk mengikuti χ 2 -Distribusi (dengan n - 1 derajat kebebasan), itu harus benar bahwa: n Σ i = 1 ( O i - E i ) 2 untuk independen,Zinormal standar(Wikipedia). Ketentuan untuk tes ini adalah sebagai berikut (sekali lagi, dariWikipedia):
- Sampel mewakili populasi
- Ukuran sampel besar
- Jumlah sel yang diharapkan cukup besar
- Kemandirian di antara setiap kategori
Dari kondisi (1,2) jelas bahwa kami memenuhi persyaratan untuk inferensi dari sampel ke populasi. (3) tampaknya merupakan asumsi yang diperlukan karena penghitungan diskrit , yang ada dalam penyebutnya, tidak menghasilkan distribusi yang hampir kontinu untuk setiap Z i dan jika tidak cukup besar ada kesalahan yang dapat diperbaiki dengan koreksi Yates - ini tampaknya dari fakta bahwa distribusi diskrit pada dasarnya adalah 'berlantai' satu terus menerus, sehingga pergeseran oleh 1 / 2 untuk masing-masing mengoreksi ini.
Perlunya (4) tampaknya berguna nanti, tetapi saya tidak bisa melihat caranya.
Pada awalnya, saya berpikir bahwa diperlukan untuk statistik agar sesuai dengan distribusi. Ini membawa saya pada asumsi yang dipertanyakan bahwaOi-Ei∼N(0,√, yang memang salah. Bahkan, jelas dari reduksi dimensi untuk dua sisi kesetaraan darinken-1bahwa hal ini tidak dapat terjadi.