Menggunakan bootstrap, saya menghitung nilai p dari tes signifikansi menggunakan dua metode:
- resampling di bawah hipotesis nol dan menghitung hasil setidaknya paling ekstrim sebagai hasil yang berasal dari data asli
- resampling di bawah hipotesis alternatif dan menghitung hasil setidaknya sama jauh dari hasil asli sebagai nilai yang sesuai dengan hipotesis nol
Saya percaya bahwa 1 st pendekatan adalah sepenuhnya benar karena mengikuti definisi nilai ap. Saya kurang yakin tentang yang kedua, tetapi biasanya memberikan hasil yang sangat mirip dan mengingatkan saya pada tes Wald.
Apakah saya benar? Apakah kedua metode ini benar? Apakah identik (untuk sampel besar)?
Contoh untuk dua metode (suntingan setelah pertanyaan DWin dan jawaban Erik):
Contoh 1. Mari kita membuat tes bootstrap mirip dengan dua uji T sampel. Metode 1 akan sampel ulang dari satu sampel (diperoleh dengan menggabungkan dua yang asli). Metode 2 akan melakukan sampel ulang dari kedua sampel secara independen.Contoh 2. Mari kita buat tes bootstrap korelasi antara x₁ ... xₐ dan y₁ ... yₐ. Metode 1 akan menganggap tidak ada korelasi dan sampel ulang memungkinkan untuk (xₑ, yₔ) pasangan mana e ≠ ə. Metode 2 akan mengkompilasi sampel bootstrap dari pasangan asli (x, y).
Contoh 3. Mari kita membuat tes bootstrap untuk memeriksa apakah koin itu adil. Metode 1 akan membuat pengaturan sampel acak Pr (head) = Pr (tail) = ½. Metode 2 akan menguji ulang sampel nilai kepala / ekor eksperimental dan membandingkan proporsinya dengan ½.