Ada beberapa kesulitan yang umum untuk semua perkiraan bootstrap nonparametric interval kepercayaan (CI), beberapa yang lebih merupakan masalah dengan "empiris" (disebut "dasar" dalam boot.ci()
fungsi boot
paket R dan dalam Ref. 1 ) dan perkiraan CI "persentil" (seperti yang dijelaskan dalam Pustaka 2 ), dan beberapa yang dapat diperburuk dengan CI persentil.
TL; DR : Dalam beberapa kasus, perkiraan bootstrap CI perkiraan mungkin berfungsi dengan baik, tetapi jika asumsi tertentu tidak berlaku maka CI persentase mungkin merupakan pilihan terburuk, dengan bootstrap empiris / dasar terburuk berikutnya. Perkiraan bootstrap CI lainnya bisa lebih andal, dengan jangkauan yang lebih baik. Semua bisa bermasalah. Melihat plot diagnostik, seperti biasa, membantu menghindari potensi kesalahan yang timbul dengan hanya menerima output dari rutin perangkat lunak.
Pengaturan bootstrap
Umumnya mengikuti terminologi dan argumen Ref. 1 , kita memiliki sampel data diambil dari variabel-variabel acak independen dan terdistribusi secara identik berbagi fungsi distribusi kumulatif . Fungsi distribusi empiris (EDF) dibangun dari sampel data . Kami tertarik pada karakteristik dari populasi, diperkirakan oleh statistik yang nilainya dalam sampel adalah . Kami ingin mengetahui seberapa baik estimasi , misalnya, distribusi .y1,...,ynYiFF^θTtTθ(T−θ)
Bootstrap nonparametrik menggunakan sampling dari EDF untuk meniru sampling dari , mengambil sampel masing-masing ukuran dengan penggantian dari . Nilai yang dihitung dari sampel bootstrap dilambangkan dengan "*". Misalnya, statistik dihitung pada sampel bootstrap j memberikan nilai .F^FRnyiTT∗j
CI bootstrap empiris / dasar versus persentil
Bootstrap empiris / dasar menggunakan distribusi antara sampel bootstrap dari untuk memperkirakan distribusi dalam populasi yang dijelaskan oleh itu sendiri. Perkiraan CI berdasarkan pada distribusi , di mana adalah nilai statistik dalam sampel asli.(T∗−t)RF^(T−θ)F(T∗−t)t
Pendekatan ini didasarkan pada prinsip dasar bootstrap ( Ref. 3 ):
Populasi adalah sampel karena sampel adalah sampel bootstrap.
Bootstrap persentil malahan menggunakan kuantil dari nilai sendiri untuk menentukan CI. Perkiraan ini bisa sangat berbeda jika ada bias atau bias dalam distribusi .T∗j(T−θ)
Katakan bahwa ada bias diamati sehingga:
B
T¯∗=t+B,
di mana adalah rata-rata dari . Untuk konkret, katakan bahwa persentil ke-5 dan ke-95 dari dinyatakan sebagai dan , di mana adalah rata-rata dari sampel bootstrap dan masing-masing positif dan berpotensi berbeda untuk memungkinkan kemiringan. Estimasi berbasis persentil CI ke-5 dan ke-95 akan secara langsung diberikan masing-masing oleh:T¯∗T∗jT∗jT¯∗−δ1T¯∗+δ2T¯∗δ1,δ2
T¯∗−δ1=t+B−δ1;T¯∗+δ2=t+B+δ2.
Perkiraan CI persentil ke-5 dan ke-95 dengan metode bootstrap empiris / dasar adalah masing-masing ( Pustaka 1 , persamaan 5.6, halaman 194):
2t−(T¯∗+δ2)=t−B−δ2;2t−(T¯∗−δ1)=t−B+δ1.
Jadi CI berbasis persentil mendapatkan bias yang salah dan membalik arah dari posisi yang berpotensi asimetris dari batas kepercayaan di sekitar pusat yang bias ganda . Persentil CI dari bootstrap dalam kasus seperti itu tidak mewakili distribusi .(T−θ)
Perilaku ini diilustrasikan dengan baik di halaman ini , untuk bootstrap statistik yang sangat negatif sehingga estimasi sampel asli di bawah 95% CI berdasarkan metode empiris / dasar (yang secara langsung mencakup koreksi bias yang sesuai). 95% CI berdasarkan metode persentil, disusun di sekitar pusat yang bias dua kali lipat negatif, sebenarnya keduanya di bawah bahkan estimasi titik bias negatif dari sampel asli!
Haruskah bootstrap persentil tidak pernah digunakan?
Itu mungkin berlebihan atau meremehkan, tergantung pada perspektif Anda. Jika Anda dapat mendokumentasikan bias dan kemiringan minimal, misalnya dengan memvisualisasikan distribusi dengan histogram atau plot kerapatan, bootstrap persentil harus pada dasarnya memberikan CI yang sama dengan CI empiris / dasar. Ini mungkin keduanya lebih baik daripada perkiraan normal sederhana untuk CI.(T∗−t)
Namun, tidak ada pendekatan yang menyediakan akurasi dalam cakupan yang dapat disediakan oleh pendekatan bootstrap lainnya. Efron sejak awal mengakui keterbatasan potensial dari CI persentil tetapi mengatakan: "Sebagian besar kita akan puas membiarkan berbagai tingkat keberhasilan dari contoh-contoh itu berbicara sendiri." ( Ref. 2 , halaman 3)
Pekerjaan selanjutnya, dirangkum misalnya oleh DiCiccio dan Efron ( Ref. 4 ), mengembangkan metode yang "meningkatkan dengan urutan besarnya pada keakuratan interval standar" yang disediakan oleh metode empiris / dasar atau persentil. Dengan demikian orang mungkin berpendapat bahwa metode empiris / dasar maupun persentil tidak boleh digunakan, jika Anda peduli dengan keakuratan intervalnya.
Dalam kasus-kasus ekstrem, misalnya pengambilan sampel langsung dari distribusi lognormal tanpa transformasi, tidak ada perkiraan CI yang di-boot-up mungkin dapat diandalkan, seperti yang dicatat oleh Frank Harrell .
Apa yang membatasi keandalan CI ini dan bootstrap lainnya?
Beberapa masalah cenderung membuat CI yang bootstrap tidak dapat diandalkan. Beberapa berlaku untuk semua pendekatan, yang lain dapat dikurangi dengan pendekatan selain metode empiris / dasar atau persentil.
Pertama, umum, masalah adalah seberapa baik distribusi empiris mewakili distribusi penduduk . Jika tidak, maka tidak ada metode bootstrap yang dapat diandalkan. Khususnya, bootstrap untuk menentukan apa pun yang dekat dengan nilai ekstrim dari suatu distribusi bisa tidak dapat diandalkan. Masalah ini dibahas di tempat lain di situs ini, misalnya di sini dan di sini . Beberapa, nilai diskrit, tersedia dalam ekor untuk sampel tertentu mungkin tidak mewakili ekor kontinu dengan sangat baik. Kasus ekstrem namun ilustratif mencoba menggunakan bootstrap untuk memperkirakan statistik urutan maksimum sampel acak dari seragamF^FF^FU[0,θ]distribusi, seperti yang dijelaskan dengan baik di sini . Perhatikan bahwa bootstrap 95% atau 99% CI dengan sendirinya berada di belakang distribusi dan dengan demikian dapat menderita masalah seperti itu, terutama dengan ukuran sampel kecil.
Kedua, tidak ada jaminan bahwa sampel dari setiap kuantitas dari akan memiliki distribusi yang sama seperti sampel dari . Namun asumsi itu mendasari prinsip dasar bootstrap. Kuantitas dengan properti yang diinginkan disebut penting . Seperti yang dijelaskan AdamO :F^F
Ini berarti bahwa jika parameter yang mendasarinya berubah, bentuk distribusi hanya bergeser oleh konstanta, dan skala tidak selalu berubah. Ini asumsi yang kuat!
Misalnya, jika ada bias, penting untuk mengetahui bahwa pengambilan sampel dari sekitar sama dengan pengambilan sampel dari sekitar . Dan ini adalah masalah khusus dalam pengambilan sampel nonparametrik; sebagai Ref. 1 meletakkannya di halaman 33:FθF^t
Dalam masalah nonparametrik situasinya lebih rumit. Sekarang tidak mungkin (tetapi tidak sepenuhnya mustahil) bahwa kuantitas apa pun dapat menjadi sangat penting.
Jadi yang terbaik yang biasanya mungkin adalah perkiraan. Masalah ini, bagaimanapun, seringkali dapat diatasi secara memadai. Mungkin untuk memperkirakan seberapa dekat kuantitas sampel dengan pivotal, misalnya dengan pivot plot seperti yang direkomendasikan oleh Canty et al . Ini dapat menampilkan bagaimana distribusi estimasi bootstrap berbeda dengan , atau seberapa baik transformasi memberikan kuantitas yang sangat penting. Metode untuk meningkatkan CI bootstrap dapat mencoba untuk menemukan transformasi sedemikian sehingga lebih dekat dengan penting untuk memperkirakan CI dalam skala yang ditransformasikan, kemudian mengubah kembali ke skala semula.(T∗−t)th(h(T∗)−h(t))h(h(T∗)−h(t))
The boot.ci()
Fungsi menyediakan studentized bootstrap CI (disebut "bootstrap- t " oleh DiCiccio dan Efron ) dan CI (bias diperbaiki dan dipercepat, di mana "percepatan" penawaran dengan condong) yang "orde kedua akurat" di bahwa perbedaan antara cakupan yang diinginkan dan dicapai (mis., 95% CI) ada di urutan , dibandingkan hanya urutan pertama yang akurat (urutan ) untuk metode empiris / dasar dan persentil ( Ref 1 , hlm. 212-3; ref. 4 ). Metode-metode ini, bagaimanapun, memerlukan melacak varians dalam masing-masing sampel yang di-bootstrap, bukan hanya nilai individual dariBCaαn−1n−0.5T∗j digunakan oleh metode yang lebih sederhana.
Dalam kasus ekstrim, seseorang mungkin perlu menggunakan bootstrap dalam sampel bootstrap sendiri untuk memberikan penyesuaian interval kepercayaan yang memadai. "Double Bootstrap" ini dijelaskan dalam Bagian 5.6 dari Ref. 1 , dengan bab-bab lain dalam buku itu menyarankan cara-cara untuk meminimalkan tuntutan komputasi ekstremnya.
Davison, AC dan Hinkley, Metode Bootstrap DV dan Penerapannya, Cambridge University Press, 1997 .
Efron, B. Metode Bootstrap: Lain melihat masa depan, Ann. Statist. 7: 1-26, 1979 .
Fox, J. dan Weisberg, S. Model regresi bootstrap di R. Sebuah Lampiran untuk R Pendamping untuk Regresi Terapan, Edisi Kedua (Sage, 2011). Revisi pada 10 Oktober 2017 .
Interval kepercayaan DiCiccio, TJ dan Efron, B. Bootstrap. Stat. Sci. 11: 189-228, 1996 .
Canty, AJ, Davison, AC, Hinkley, DV, dan Ventura, V. Bootstrap diagnostik dan solusi. Bisa. J. Stat. 34: 5-27, 2006 .