Mengapa tidak selalu menggunakan CI bootstrap?

Saya bertanya-tanya bagaimana CI bootstrap (dan BCa di barticular) melakukan pada data yang terdistribusi normal. Tampaknya ada banyak pekerjaan yang memeriksa kinerja mereka pada berbagai jenis distribusi, tetapi tidak dapat menemukan apa pun pada data yang didistribusikan secara normal. Karena tampaknya hal yang jelas untuk dipelajari pertama kali, saya kira kertas-kertas itu terlalu tua.

Saya melakukan beberapa simulasi Monte Carlo menggunakan paket boot R dan menemukan bootstrap CI sesuai dengan CI yang tepat, meskipun untuk sampel kecil (N <20) mereka cenderung sedikit liberal (CI lebih kecil). Untuk sampel yang cukup besar, mereka pada dasarnya sama.

Ini membuat saya bertanya-tanya apakah ada alasan bagus untuk tidak selalu menggunakan bootstrap. Mengingat sulitnya menilai apakah suatu distribusi itu normal, dan banyak jebakan di balik ini, tampaknya masuk akal untuk tidak memutuskan dan melaporkan bootstrap CI terlepas dari distribusinya. Saya memahami motivasi untuk tidak menggunakan tes non-parametrik secara sistematis, karena mereka memiliki daya yang lebih kecil, tetapi simulasi saya mengatakan kepada saya ini bukan kasus untuk bootstrap CI. Mereka bahkan lebih kecil.

Pertanyaan serupa yang menggangguku adalah mengapa tidak selalu menggunakan median sebagai ukuran tendensi sentral. Orang sering merekomendasikan untuk menggunakannya untuk mengkarakterisasi data yang tidak terdistribusi normal, tetapi karena mediannya sama dengan rata-rata untuk data yang terdistribusi normal, mengapa membuat perbedaan? Tampaknya cukup menguntungkan jika kita dapat menghilangkan prosedur untuk memutuskan apakah suatu distribusi normal atau tidak.

Saya sangat ingin tahu tentang pemikiran Anda tentang masalah ini, dan apakah mereka telah dibahas sebelumnya. Referensi akan sangat dihargai.

Terima kasih!

Pierre

— dragice
sumber

Lihat pertanyaan saya di sini mengenai mean dan median: stats.stackexchange.com/questions/96371/…

— Alexis

Untuk banyak masalah, resampling tidak layak secara komputasi. Misalnya, jika Anda hanya ingin menghitung CI untuk matriks 3D besar, atau untuk seri waktu yang lama.

— jona

Adalah bermanfaat untuk melihat motivasi untuk interval BCa dan mekanismenya (yaitu yang disebut "faktor koreksi"). Interval BCa adalah salah satu aspek terpenting dari bootstrap karena mereka adalah kasus yang lebih umum dari Interval Bootstrap Persentil (yaitu interval kepercayaan hanya berdasarkan distribusi bootstrap itu sendiri).

Secara khusus, lihat hubungan antara interval BCa dan Interval Persentase Bootstrap: ketika penyesuaian untuk akselerasi ("faktor koreksi" pertama) dan kemiringan ("faktor koreksi" kedua) sama-sama nol, maka interval BCa kembali ke Interval Persentil Bootstrap yang khas.

Saya tidak berpikir itu akan menjadi ide yang bagus untuk SELALU menggunakan bootstrap. Bootstrap adalah teknik yang kuat yang memiliki berbagai mekanisme (mis: interval kepercayaan dan ada variasi bootstrap yang berbeda untuk berbagai jenis masalah seperti bootstrap liar ketika ada heteroskedastisitas) untuk menyesuaikan masalah yang berbeda (mis: non-normalitas) ), tetapi ini bergantung pada satu asumsi penting: data secara akurat mewakili populasi yang sebenarnya.

Asumsi ini, meskipun sederhana di alam, bisa sulit untuk diverifikasi terutama dalam konteks ukuran sampel kecil (bisa jadi bahwa sampel kecil adalah cerminan akurat dari populasi yang sebenarnya!). Jika sampel asli tempat distribusi bootstrap (dan karenanya semua hasil yang mengikuti darinya) tidak cukup akurat, maka hasil Anda (dan karenanya keputusan Anda berdasarkan hasil tersebut) akan cacat.

KESIMPULAN: Ada banyak ambiguitas dengan bootstrap dan Anda harus berhati-hati sebelum menerapkannya.

— mmmmmmmmmm
sumber

"Jika sampel asli tempat distribusi bootstrap (dan karenanya semua hasil yang mengikuti) tidak cukup akurat, maka hasil Anda (dan karenanya keputusan Anda berdasarkan hasil itu) akan cacat." -> tetapi apakah bootstrap CI berkinerja lebih buruk daripada alternatif analitik dalam kasus ini?

— jona

Asumsi bahwa data yang cukup mewakili populasi tidak eksklusif hanya untuk bootstrap: itu berkaitan dengan statistik secara umum, jadi jika data tidak memadai maka setiap kesimpulan, kesimpulan bootstrap atau sebaliknya, yang telah dibuat menyesatkan (asumsi palsu menyiratkan ada kesimpulan!).

— mmmmmmmmmm

Jadi peringatan ini tidak diarahkan pada bootstrap, tetapi tentang kesimpulan, dan bukan argumen yang menentang penggunaan bootstrap atas metode lain, tetapi tentang menempatkan keyakinan absolut dalam metode yang keliru. Saya tidak melihat bagaimana itu relevan dalam konteks ini.

— jona

Maaf, sedikit terlambat pada utas ini .... @ jona: tidakkah ini relevan karena bootstrap akan semakin memperbesar sampel? Jadi jika sampel Anda adalah gambaran yang salah tentang populasi maka menggunakan bootstrap akan membuat Anda semakin jauh dari pusat populasi? Bukankah itu argumen potensial untuk tidak mengandalkan bootstrap secara sistematis?

— sisdog