Saya bertanya-tanya bagaimana CI bootstrap (dan BCa di barticular) melakukan pada data yang terdistribusi normal. Tampaknya ada banyak pekerjaan yang memeriksa kinerja mereka pada berbagai jenis distribusi, tetapi tidak dapat menemukan apa pun pada data yang didistribusikan secara normal. Karena tampaknya hal yang jelas untuk dipelajari pertama kali, saya kira kertas-kertas itu terlalu tua.
Saya melakukan beberapa simulasi Monte Carlo menggunakan paket boot R dan menemukan bootstrap CI sesuai dengan CI yang tepat, meskipun untuk sampel kecil (N <20) mereka cenderung sedikit liberal (CI lebih kecil). Untuk sampel yang cukup besar, mereka pada dasarnya sama.
Ini membuat saya bertanya-tanya apakah ada alasan bagus untuk tidak selalu menggunakan bootstrap. Mengingat sulitnya menilai apakah suatu distribusi itu normal, dan banyak jebakan di balik ini, tampaknya masuk akal untuk tidak memutuskan dan melaporkan bootstrap CI terlepas dari distribusinya. Saya memahami motivasi untuk tidak menggunakan tes non-parametrik secara sistematis, karena mereka memiliki daya yang lebih kecil, tetapi simulasi saya mengatakan kepada saya ini bukan kasus untuk bootstrap CI. Mereka bahkan lebih kecil.
Pertanyaan serupa yang menggangguku adalah mengapa tidak selalu menggunakan median sebagai ukuran tendensi sentral. Orang sering merekomendasikan untuk menggunakannya untuk mengkarakterisasi data yang tidak terdistribusi normal, tetapi karena mediannya sama dengan rata-rata untuk data yang terdistribusi normal, mengapa membuat perbedaan? Tampaknya cukup menguntungkan jika kita dapat menghilangkan prosedur untuk memutuskan apakah suatu distribusi normal atau tidak.
Saya sangat ingin tahu tentang pemikiran Anda tentang masalah ini, dan apakah mereka telah dibahas sebelumnya. Referensi akan sangat dihargai.
Terima kasih!
Pierre