Pertanyaan ini telah dipicu oleh sesuatu yang saya baca di buku teks statistik tingkat pascasarjana ini dan juga (secara independen) didengar selama presentasi ini di seminar statistik. Dalam kedua kasus, pernyataan itu sepanjang garis "karena ukuran sampel cukup kecil, kami memutuskan untuk melakukan estimasi melalui bootstrap daripada (atau bersamaan dengan) metode parametrik ".
Mereka tidak masuk ke dalam rincian, tapi mungkin alasan itu sebagai berikut: Metode mengasumsikan data mengikuti distribusi parametrik tertentu . Pada kenyataannya, distribusinya tidak sepenuhnya , tetapi itu boleh saja asalkan ukuran sampelnya cukup besar. Karena dalam kasus ini ukuran sampel terlalu kecil, mari beralih ke bootstrap (non-parametrik) yang tidak membuat asumsi distribusi. Masalah terpecahkan!
Menurut pendapat saya, bukan itu gunanya bootstrap. Begini cara saya melihatnya: bootstrap dapat memberikan keunggulan pada satu orang ketika lebih atau kurang jelas bahwa ada cukup data, tetapi tidak ada solusi bentuk tertutup untuk mendapatkan kesalahan standar, nilai-p dan statistik serupa. Contoh klasik adalah mendapatkan CI untuk koefisien korelasi yang diberikan sampel dari distribusi normal bivariat: solusi bentuk tertutup ada, tetapi sangat berbelit-belit sehingga bootstrap lebih sederhana. Namun, tidak ada yang menyiratkan bahwa bootstrap dapat membantu seseorang untuk lolos dengan ukuran sampel yang kecil.
Apakah persepsi saya benar?
Jika Anda menemukan pertanyaan ini menarik, ada pertanyaan lain, bootstrap yang lebih spesifik dari saya:
Bootstrap: masalah overfitting
PS Saya tidak dapat membantu berbagi satu contoh mengerikan dari "pendekatan bootstrap". Saya tidak mengungkapkan nama penulisnya, tetapi dia adalah salah satu dari "quants" generasi tua yang menulis buku tentang Keuangan Kuantitatif pada tahun 2004. Contohnya diambil dari sana.
Pertimbangkan masalah berikut: misalkan Anda memiliki 4 aset dan 120 pengamatan pengembalian bulanan untuk masing-masing. Tujuannya adalah untuk membangun cdf bersama 4 dimensi dari pengembalian tahunan. Bahkan untuk satu aset, tugas tersebut tampaknya sulit dicapai dengan hanya 10 pengamatan tahunan, apalagi estimasi cdf 4 dimensi. Tetapi tidak perlu khawatir, "bootstrap" akan membantu Anda: ambil semua pengamatan 4 dimensi yang tersedia, sampel ulang 12 dengan penggantian dan gabungkan mereka untuk membangun satu vektor 4-dimensi "bootstrapped" dari pengembalian tahunan. Ulangi 1000 kali dan, lihatlah, Anda mendapatkan "sampel bootstrap" untuk diri sendiri dari pengembalian tahunan. Gunakan ini sebagai sampel pertama ukuran 1000 untuk keperluan estimasi cdf, atau kesimpulan lain yang dapat diambil dari sejarah seribu tahun.