Mengapa data harus diamplas dengan hipotesis nol dalam pengujian hipotesis bootstrap?


11

Aplikasi langsung dari metode bootstrap untuk pengujian hipotesis adalah untuk memperkirakan interval kepercayaan statistik uji dengan berulang kali menghitungnya pada sampel bootstrap (Biarkan statistik sampel dari bootstrap disebut ). Kami menolak jika parameter hipotesis (yang biasanya sama dengan 0) berada di luar interval kepercayaan dari . θ ^ θ * H0θ0 ^ θ *θ^θ^θ^H0θ0θ^

Saya pernah membaca, bahwa metode ini tidak memiliki kekuatan. Dalam artikel oleh Hall P. dan Wilson SR "Two Guidelines for Bootstrap Hypothesis Testing" (1992) itu ditulis sebagai pedoman pertama, bahwa seseorang harus menguji ulang , tidak the . Dan ini adalah bagian yang saya tidak mengerti.^ θ * -θ0θ^-θ^θ^-θ0

Bukankah itu hanya mengukur bias estimator ? Untuk penaksir yang tidak bias, interval kepercayaan dari ungkapan ini harus selalu lebih kecil dari , tapi saya gagal melihat, apa hubungannya dengan pengujian untuk ? Tidak ada tempat saya bisa melihat kami menaruh informasi tentang .^ θ * ^ θ * -θ0 θ =θ0θ0θ^-θ^θ^θ^-θ0θ^=θ0θ0


Bagi Anda, yang tidak memiliki akses ke artikel ini, ini adalah kutipan dari paragraf yang relevan yang datang segera setelah tesis:

Untuk menghargai mengapa ini penting, amati bahwa tes akan melibatkan penolakan jika di terlalu besar." Jika jauh dari nilai true (yaitu, jika adalah kesalahan) maka perbedaan tidak akan pernah terlihat terlalu besar dibandingkan dengan distribusi bootstrap nonparametric dari. Perbandingan yang lebih bermakna adalah dengan distribusi. Bahkan, jika nilai sebenarnya dari adalah| Θ - θ 0 | θ 0 θ H 0 | Θ - θ 0 | | Θ - θ 0 | | ^ Θ * - θ | θ θ 1 | θ 1 - θ 0 | | ^ Θ * - θ | | θ 1 - θ 0 |H0|θ^-θ0|θ0θH0|θ^-θ0||θ^-θ0||θ^-θ^|θθ1maka kekuatan tes bootstrap meningkat menjadi 1 saatmeningkat, asalkan tes didasarkan pada resampling , tetapi daya berkurang paling banyak ke tingkat signifikansi (seperti meningkat) jika tes didasarkan pada resampling |θ1-θ0||θ^-θ^||θ1-θ0||θ^-θ0|

Jawaban:


7

Ini adalah prinsip analogi bootstrap. The (tidak diketahui) yang mendasari benar distribusi yang dihasilkan sampel di tangan x 1 , ... , x n dengan cdf F n , yang pada gilirannya menghasilkan statistik θ = T ( F n ) untuk beberapa fungsional T ( ) . Gagasan Anda menggunakan bootstrap adalah membuat pernyataan tentang distribusi sampling berdasarkan pada distribusi yang diketahui ˜ FFx1,...,xnFnθ^=T(Fn)T()F~, di mana Anda mencoba menggunakan protokol pengambilan sampel yang identik (yang hanya mungkin dilakukan untuk data iid; data dependen selalu mengarah pada keterbatasan seberapa akurat seseorang dapat mereproduksi proses pengambilan sampel), dan menerapkan fungsional yang sama ( ) . Saya menunjukkannya di pos lain dengan (apa yang saya pikirkan) diagram yang rapi. Jadi bootstrap analog dari (sampel + sistematis) deviasi θ - θ 0 , jumlah bunga pusat Anda, adalah deviasi dari bootstrap replikasi θ * dari apa yang dikenal untuk menjadi kenyataan untuk distribusi ~ F , sampling proses yang Anda terapkan, dan fungsionalT()θ^-θ0θ^F~ , yaitu ukuran kecenderungan sentral Anda adalah T ( ˜ F ) . Jika Anda menggunakan bootstrap nonparametrik standar dengan pengganti dari data asli, Anda ~ F = F n , sehingga ukuran Anda dari tendensi sentral harus T ( F n ) q berdasarkan data asli.T()T(F~)F~=FnT(Fn)θ^

Selain terjemahan, ada masalah yang lebih subtil dengan tes bootstrap yang terkadang sulit diatasi. Distribusi statistik uji di bawah nol dapat secara drastis berbeda dari distribusi statistik uji di bawah alternatif (misalnya, dalam tes pada batas ruang parameter yang gagal dengan bootstrap ). Tes sederhana yang Anda pelajari di kelas sarjana seperti uji- adalah invarian di bawah shift, tetapi berpikir, "Heck, saya hanya menggeser semuanya" gagal setelah Anda harus pindah ke tingkat berikutnya dari kompleksitas konseptual, tes ym 2 asimptotik . Berpikir tentang hal ini: Anda menguji bahwa μ = 0 , dan Anda diamati ˉ x =tχ2μ=0 . Kemudian ketika Anda membuattes χ 2 ( ˉ x - μ ) 2 / ( s 2 / n ) ˉ x 2 / ( s 2 / n ) dengan analog bootstrap ˉ x 2 / ( s 2 / n ) , maka tes ini memiliki built-in non-centrality dari n ˉ x 2 / s 2x¯=0,78χ2(x¯-μ)2/(s2/n)x¯2/(s2/n)x¯2/(s2/n)nx¯2/s2dari awal, alih-alih menjadi ujian utama seperti yang kita harapkan. Untuk membuat tes bootstrap menjadi pusat, Anda benar-benar harus mengurangi perkiraan aslinya.

Tes tidak dapat dihindari dalam konteks multivariat, mulai dari Pearson χ 2 untuk tabel kontingensi hingga bootstrap Bollen-Stine dari statistik uji dalam model persamaan struktural. Konsep menggeser distribusi sangat sulit untuk didefinisikan dengan baik dalam situasi ini ... walaupun dalam kasus tes pada matriks kovarians multivariat, hal ini dapat dilakukan dengan rotasi yang tepat .χ2χ2


θ0H0θ0

θ0

3

OK, saya mengerti. Terima kasih, StasK, untuk jawaban yang bagus. Saya akan membuatnya diterima untuk dipelajari orang lain, tetapi dalam kasus khusus saya, saya kehilangan fakta yang sangat sederhana:

Prosedur bootstrap sesuai dengan pedoman Hall & Wilson untuk tes rata-rata satu-sampel sederhana adalah ini (dalam kode pseudo yang terinspirasi R):

1function(dataθ0 ) {
2 θ^ t.test(data, mu = θ0 )$statistic
3 count 0
4for(i in 1:1000){
5 bdata sample(data)
6 θ^ t.test(bdata, mu = θ^ )$statistic
7 if ( θ^θ^ ) count++
8 }
9 count/1000
10 }

θ02θ^

26p.valuestatistic7


θ^θθ0(θ^-θ^)(θ^-θ0)

1
Mungkin membantu: Michael Chernick memberikan intuisi ringkas dalam menjawab pertanyaan terkait saya di sini. stats.stackexchange.com/questions/289236/… )
setengah lulus
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.