Bagaimana cara menguji apakah rata-rata subkelompok berbeda dari keseluruhan kelompok yang mencakup subkelompok?


9

Bagaimana saya dapat menguji apakah rata-rata (misalnya, tekanan darah) dari subkelompok (misalnya, mereka yang meninggal) berbeda dari seluruh kelompok (misalnya, setiap orang yang memiliki penyakit termasuk yang meninggal)?

Jelas, yang pertama adalah subkelompok yang kedua.

Tes hipotesis apa yang harus saya gunakan?


Apakah Anda menguji perbedaan cara?
Makro

Jawaban:


9

Seperti yang dicatat oleh Michael, ketika membandingkan sebuah subkelompok dengan suatu kelompok secara keseluruhan, para peneliti biasanya membandingkan subkelompok tersebut dengan subkelompok dari keseluruhan kelompok yang tidak termasuk dalam subkelompok tersebut.

Pikirkan seperti ini.

Jika adalah proporsi yang mati, dan adalah proporsi yang tidak mati, dan1 - pp1p

X¯.=pX¯d+(1p)X¯a

di manaadalah rata-rata keseluruhan, adalah rata-rata dari mereka yang mati, dan adalah rata-rata dari mereka yang masih hidup. Kemudianˉ X d ˉ X aX¯.X¯dX¯a

X¯dX¯a
jika dan hanya jika ketika

X¯dX¯.

Misalkan . Karenanya . ¯ X . p ¯ X d +(1-p) ¯ X d = ¯ X dXd¯Xa¯X.¯pXd¯+(1p)Xd¯=Xd¯

Misalkan . Karenanya , lalu dan karena , maka . ¯ X dp ¯ X d +(1-p) ¯ X a (1-p) ¯ X d(1-p) ¯ X a (1-p)0 ¯ X d ¯ X aX.¯Xd¯Xd¯pXd¯+(1p)Xa¯(1p)Xd¯(1p)Xa¯(1p)0Xd¯Xa¯

Yang sama bisa lakukan untuk ketidaksetaraan.

Dengan demikian, peneliti biasanya menguji perbedaan antara subkelompok dan subkelompok dari keseluruhan kelompok yang tidak termasuk dalam subkelompok. Ini memiliki efek menunjukkan bahwa subkelompok berbeda dari kelompok keseluruhan. Ini juga memungkinkan Anda menggunakan metode konvensional seperti uji-t kelompok independen.


1
Re: "Anda harus membandingkan subkelompok dengan subkelompok dari keseluruhan kelompok yang tidak termasuk dalam subkelompok" - ya, ini adalah cara untuk melakukannya tetapi ia menanyakan pertanyaan yang sedikit berbeda - ia menguji mati atau tidak mati ketika itu Tampaknya OP ingin menguji perbedaan cara antara orang mati dan seseorang yang status kematiannya tidak diketahui, jadi saya tidak yakin apakah itu kata yang tepat. Anda dapat menguji perbedaan rata-rata antara subset dan grup secara keseluruhan selama Anda memperhitungkan kovarians antara dan Dalam perhitungan kesalahan standar Anda. ¯ X .X¯dX¯.
Makro

@ Macro poin bagus. Terima kasih. Saya mengubah kata-katanya sedikit menjadi "peneliti biasanya ..."
Jeromy Anglim

@Marco. Terima kasih atas komentarnya. Tetapi bagaimana kovarians dihitung dari dan dari grup yang tidak berpasangan (subkelompok dan grup)? ˉ XX¯dX¯
giordano

@ JeromyAnglim saya tidak berpikir Anda membutuhkan "biasanya." Jika kami menulis apa yang Anda tulis dalam notasi populasi (mis. Mu bukan x-bar misalnya) dan memeriksa hipotesis nol dan alternatif, dengan argumen yang sama yang Anda buat, menguji bahwa mu berbeda dari mu_d identik dengan menguji mu_a berbeda dari mu_d. Jadi melakukan uji t dua sampel selalu benar. Jadi alih-alih biasanya saya akan mengatakan "ini setara dengan melakukan tes ini dengan uji-dua sampel"
Richard DiSalvo

2

Cara untuk menguji di sini adalah dengan membandingkan mereka yang memiliki penyakit dan meninggal dengan mereka yang memiliki penyakit dan tidak mati. Anda dapat menerapkan dua uji sampel t atau uji jumlah peringkat Wilcoxon jika normalitas tidak dapat diasumsikan.


Bisakah Anda lebih spesifik? apa jenis dua sampel uji t? uji t tidak berpasangan? Saya pikir untuk uji t, Anda menganggap INDEPENDENSI dan NORMALITAS.
user1061210

1
Ketika kelompok terpisah seperti yang kami sarankan sampel independen. Uji t akan tidak berpasangan karena subkelompok tidak perlu sama dan tidak ada cara alami untuk memasangkan sampel bahkan jika ukuran sampel sama. Saya menyebutkan tes Wilcoxon karena asumsi normalitas mungkin tidak valid dan tes Wilcoxon tidak memerlukan normalitas.
Michael R. Chernick

0

Yang perlu Anda lakukan adalah menguji proporsi populasi (ukuran sampel besar). Statistik yang melibatkan proporsi populasi sering memiliki ukuran sampel yang besar (n => 30), oleh karena itu distribusi perkiraan normal dan statistik terkait digunakan untuk menentukan tes apakah proporsi sampel (tekanan darah mereka yang meninggal) = proporsi populasi (semua orang) yang menderita penyakit termasuk yang meninggal).

Yaitu, ketika ukuran sampel lebih besar dari atau sama dengan 30 kita dapat menggunakan statistik z-skor untuk membandingkan proporsi sampel terhadap proporsi populasi menggunakan nilai sampel standar deviasi p-hat, untuk memperkirakan standar deviasi sampel, p jika tidak diketahui.

Distribusi sampel P (proporsi) kira-kira normal dengan nilai rata-rata atau yang diharapkan, E (P) = p-hat dan standard error, sigma (r) = sqrt (p * q / n).

Berikut ini adalah kemungkinan pertanyaan tes hipotesis yang dapat ditanyakan ketika membandingkan dua proporsi:

  1. (Uji dua sisi)

H0: p-hat = p vs H1: p-hat tidak sama dengan p

  1. (Uji ekor kanan)

H0: p-hat = p vs H1: p-hat> p

  1. (Tes ekor kiri)

H0: p-hat = p vs H1: p-hat <p

Statistik yang digunakan untuk menguji ukuran sampel besar adalah;

Statistik pengujian terkait dengan distribusi normal standar:

Statistik z-skor untuk proporsi

p-hat-p / sqrt (pq / n)

, di mana p = estimasi proporsi, q = 1-p dan merupakan proporsi populasi.

Mean proporsi adalah:

np / n = p-hat = x / n

Standar deviasi:

= sqrt (npq / n) = sqrt (pq / n)

Aturan keputusan:

Tes Ekor-Atas (): (H0: P-hat> = P)

Terima H0 jika Z <= Z (1-alpha)

Tolak H0 jika Z> Z (1-alpha)

Tes Ekor Bawah (Ha: P-hat <= P):

Terima H0 jika Z> = Z (1-alpha)

Tolak H0 jika Z

Tes Dua Ekor (Ha: P-hat tidak sama dengan P):

Terima H0 jika Z (alpha / 2) <= Z <= Z (1-alpha / 2)

Tolak H0 jika Z <Z (alpha / 2) atau jika Z> Z (1-alpha / 2)

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.