Saya memiliki tiga kelompok data, masing-masing dengan distribusi binomial (yaitu masing-masing kelompok memiliki elemen yang berhasil atau gagal). Saya tidak memiliki probabilitas keberhasilan yang diprediksi, tetapi sebaliknya hanya dapat mengandalkan tingkat keberhasilan masing-masing sebagai perkiraan untuk tingkat keberhasilan yang sebenarnya. Saya hanya menemukan pertanyaan ini , yang dekat tetapi tampaknya tidak persis berurusan dengan skenario ini.
Untuk menyederhanakan tes, anggap saja saya memiliki 2 kelompok (3 dapat diperpanjang dari kasus dasar ini).
- Uji coba Grup 1: = 2455
- Uji coba Grup 2: = 2730
- Keberhasilan grup 1: = 1556
- Keberhasilan grup 2: = 1671
Saya tidak memiliki probabilitas keberhasilan yang diharapkan, hanya yang saya tahu dari sampel. Jadi tingkat keberhasilan tersirat saya untuk kedua kelompok adalah:
- Tingkat keberhasilan Grup 1: = 1556/2455 = 63,4%
- Tingkat keberhasilan Grup 2: = 1671/2730 = 61.2%
Tingkat keberhasilan masing-masing sampel cukup dekat. Namun ukuran sampel saya juga cukup besar. Jika saya memeriksa CDF dari distribusi binomial untuk melihat betapa berbedanya itu dari yang pertama (di mana saya mengasumsikan yang pertama adalah tes nol) saya mendapatkan probabilitas yang sangat kecil bahwa yang kedua dapat dicapai.
Di Excel:
1-BINOM.DIST (1556.2455,61.2%, BENAR) = 0,012
Namun, ini tidak memperhitungkan perbedaan hasil pertama, hanya mengasumsikan hasil pertama adalah probabilitas pengujian.
Apakah ada cara yang lebih baik untuk menguji apakah kedua sampel data ini secara statistik berbeda satu sama lain?
prop.test
: prop.test(c(1556, 1671), c(2455, 2730))
.