Mengapa uji independensi menggunakan distribusi chi-squared?

Uji goodness-of-fit menggunakan statistik berikut : $\chi^2$ Dalam tes, pemberian bahwa kondisi terpenuhi, salah satu kegunaan yang-distribusiuntuk menghitung p-value yang diberikanbenar salah satu akan mengamati nilai tersebut dalam sampel yang representatif dengan ukuran yang sama.

χ_{0}^{2} = \sum_{i = 1}^{n} \frac{(O_{i} - E_{i})^{2}}{E_{i}}

$\chi_0^2=\sum_{i=1}^n\frac{(O_i-E_i)^2}{E_i}$

χ^{2}

$\chi^2$

H_{0}

$H_0$

Namun, dalam rangka untuk statistik untuk mengikuti -Distribusi (dengan derajat kebebasan), itu harus benar bahwa: $\chi_0^2$ $\chi^2$ $n-1$ untuk independen,normal standar(Wikipedia). Ketentuan untuk tes ini adalah sebagai berikut (sekali lagi, dariWikipedia):

\sum_{i = 1}^{n} \frac{(O_{i} - E_{i})^{2}}{E_{i}} = \sum_{i = 1}^{n - 1} Z_{i}^{2}

$\sum_{i=1}^n\frac{(O_i-E_i)^2}{E_i}=\sum_{i=1}^{n-1}Z_i^2$

Z_{i}

$Z_i$

Sampel mewakili populasi
Ukuran sampel besar
Jumlah sel yang diharapkan cukup besar
Kemandirian di antara setiap kategori

Dari kondisi (1,2) jelas bahwa kami memenuhi persyaratan untuk inferensi dari sampel ke populasi. (3) tampaknya merupakan asumsi yang diperlukan karena penghitungan diskrit , yang ada dalam penyebutnya, tidak menghasilkan distribusi yang hampir kontinu untuk setiap dan jika tidak cukup besar ada kesalahan yang dapat diperbaiki dengan koreksi Yates - ini tampaknya dari fakta bahwa distribusi diskrit pada dasarnya adalah 'berlantai' satu terus menerus, sehingga pergeseran oleh untuk masing-masing mengoreksi ini. $E_i$ $Z_i$ $1/2$

Perlunya (4) tampaknya berguna nanti, tetapi saya tidak bisa melihat caranya.

Pada awalnya, saya berpikir bahwa diperlukan untuk statistik agar sesuai dengan distribusi. Ini membawa saya pada asumsi yang dipertanyakan bahwa $Z_i=\frac{O_i-E_i}{\sqrt{E_i}}$ , yang memang salah. Bahkan, jelas dari reduksi dimensi untuk dua sisi kesetaraan darikebahwa hal ini tidak dapat terjadi. $O_i-E_i\sim \mathcal{N}(0, \sqrt{E_i})$ $n$ $n-1$

$Z_i$ $\frac{O_i-E_i}{\sqrt{E_i}}$ $\chi_0^2=\sum_{i=1}^{n-1}Z_i^2$ $Z_i$

$\chi_0^2$ $\chi^2$ $\frac{(O_i-E_i)^2}{E_i}$ $Z_i^2$ $Z_i$

hypothesis-testing chi-squared

— VF1
sumber

O_{i} - E_{i} \sim N (0, \sqrt{E_{i}})

$O_i-E_i\sim \mathcal{N}(0, \sqrt{E_i})$

χ^{2}

$\chi^2$

χ^{2}

$\chi^2$ $\chi^2$ $\chi^2$

Dari persamaan dua jumlah kuadrat Anda tidak dapat menyimpulkan akar kuadrat adalah istilah yang sama dengan istilah! Karena itu adalah kasus untuk bilangan belaka, itu juga merupakan kasus untuk variabel acak.

— whuber

(W_{i}), i = 1, \dots, n

$(W_i),i=1, \ldots,n$

χ

$\chi$

ν_{1}, ν_{2}, \dots, ν_{n}

$\nu_1,\nu_2,\ldots,\nu_n$

ν_{1} + ν_{2} + \dots + ν_{n} = n - 1

$\nu_1+\nu_2+\cdots+\nu_n=n-1$

ν_{i} \neq 1

$\nu_i\ne 1$

i

$i$

W_{i}

$W_i$

\sum_{i = 1}^{n} W_{i}^{2}

$\sum_{i=1}^n W_i^2$

χ^{2} (n - 1)

$\chi^2(n-1)$

n - 1

$n-1$

n

$n$

n

$n$

Jawaban:

$X$ $\lambda$ $X$ $\lambda$

\frac{(X - λ)^{2}}{λ}

$\frac{(X-\lambda)^2}{\lambda}$

z^{2}

$z^2$

\sum_{i} z_{i}^{2} = Z^{'} I Z

$\sum_i z_i^2=Z' I Z$

Z^{'} Q Z

$Z' Q Z$

Q

$Q$

\sum_{i} (z_{i} - \bar{z})^{2}

$\sum_i (z_i-\bar{z})^2$

— Placidia
sumber

Maaf, tapi Anda pasti kehilangan saya di "Jika sebaliknya, Anda lakukan ..."

— VF1

@ VF1, saya membuat perubahan, jadi saya harap ini lebih jelas. Teorema Cochrane adalah jawaban untuk pertanyaan Anda ketika sejumlah kuadrat dengan normals di dalamnya memiliki distribusi chi-kuadrat.

— Placidia

OK, saya akan lihat ini. Saya akan membiarkan pertanyaan terbuka, kalau-kalau ada orang lain yang menambahkan sesuatu.

— VF1

Biasanya ukuran sampel ditetapkan. Itu berarti mustahil bahwa entri mana pun dapat mengikuti distribusi Poisson. Oleh karena itu daya tarik untuk distribusi Poisson sepertinya hanya perkiraan - dan tampaknya meninggalkan kita tepat di tempat kita mulai.

— whuber

$\chi^2$

Z_{i} = \frac{O_{i} - E_{i}}{\sqrt{E_{i}}}

$Z_i = \frac{O_i - E_i}{\sqrt{E_i}}$

\frac{O_{i} - E_{i}}{(S t a n d a r d E r r o r O f T h e O b s e r v e d)}

$\frac{O_i - E_i}{(Standard Error Of The Observed)}$

$(StandardErrorOfTheObserved)$ $\sqrt{E_i}$ $Z_i = \frac{O_i - E_i}{\sqrt{E_i}}$

Bagaimanapun, Anda bisa membuat statistik uji formulir

Z = | Z_{1} | + | Z_{2} | + | Z_{3} | + . . .

$Z = |Z_1| + |Z_2| + |Z_3| + ...$

χ^{2} = Z_{1}^{2} + Z_{2}^{2} + Z_{3}^{2} + . . .

$\chi^2 = Z_1^2 + Z_2^2 + Z_3^2 +...$

$\chi^2$ $\chi^2$

$\chi^2$

— CamilB
sumber