Saya melihat lembar excel yang mengklaim menghitung , tetapi saya tidak mengenali cara melakukannya, dan saya bertanya-tanya apakah saya kehilangan sesuatu.
Berikut adalah data yang dianalisis:
+------------------+----------+----------+
| Total Population | Observed | Expected |
+------------------+----------+----------+
| 2000 | 42 | 32.5 |
| 2000 | 42 | 32.5 |
| 2000 | 25 | 32.5 |
| 2000 | 21 | 32.5 |
+------------------+----------+----------+
Dan di sini adalah jumlah yang dilakukan untuk setiap kelompok untuk menghitung chi square:
P = (sum of all observed)/(sum of total population) = 0.01625
A = (Observed - (Population * P)) ^2
B = Total Population * P * (1-P)
ChiSq = A/B
Jadi untuk setiap grup adalah:
2.822793
2.822793
1.759359
4.136448
Dan total Chi Square adalah: 11.54139
.
Namun, setiap contoh yang saya lihat tentang menghitung sama sekali berbeda dari ini. Saya akan lakukan untuk setiap kelompok:
chiSq = (Observed-Expected)^2 / Expected
Dan oleh karena itu untuk contoh di atas saya akan mendapatkan nilai total chi square 11.3538
.
Pertanyaan saya adalah - mengapa dalam lembar excel mereka menghitung dengan cara ini? Apakah ini pendekatan yang dikenal?
MEMPERBARUI
Alasan saya ingin tahu ini adalah karena saya mencoba mereplikasi hasil ini dalam bahasa R. Saya menggunakan fungsi chisq.test dan tidak keluar dengan nomor yang sama dengan lembar Excel. Jadi, jika ada yang tahu bagaimana melakukan pendekatan ini dalam R akan sangat membantu!
PEMBARUAN 2
Jika ada yang tertarik, inilah cara saya menghitungnya di R:
res <- matrix(c((2000-42), 42, (2000-42), 42, (2000-25), 25, (2000-21), 21), 2, 4)
chisq.test(res)
x=c(42,42,25,21);chisq.test(cbind(x,2000-x))