Haruskah seseorang selalu mengharapkan kecenderungan sentral (yaitu, rata-rata dan / atau median) sampel yang di-boot sama dengan nilai yang diamati?
Dalam kasus khusus ini saya memiliki tanggapan yang didistribusikan secara eksponensial untuk subjek di dua kondisi (saya tidak menjalankan eksperimen, saya hanya punya data). Saya telah ditugaskan untuk boot dengan ukuran efek (dalam hal Cohen d, rumus satu-sampel, yaitudimana estimasi sampel dari standar deviasi populasi. Forum untuk ini disediakan dalam Rosenthal & Rosnow (2008) pada hal 398, persamaan 13.27. Mereka menggunakan dalam penyebut karena secara historis benar, namun praktik standar telah salah mendefinisikan sebagai penggunaan , dan saya menindaklanjuti dengan kesalahan itu dalam perhitungan di atas.
Saya telah secara acak baik di dalam peserta (yaitu peserta RT dapat sampel lebih dari sekali) dan di seluruh mata pelajaran (peserta dapat sampel lebih dari satu kali) sehingga bahkan jika peserta 1 sampel dua kali, RT rata-rata mereka di kedua sampel tidak mungkin persis sama. Untuk setiap dataset acak / resampled, saya menghitung ulang d. Pada kasus ini. Apa yang saya amati adalah tren untuk nilai yang diamati dari Cohen d yang biasanya lebih dekat dengan persentil ke-97,5 dari ke persentil ke-2,5 dari nilai-nilai yang diamati yang disimulasikan. Ia juga cenderung lebih dekat ke 0 daripada median bootstrap (sebesar 5% hingga 10% dari kepadatan distribusi yang disimulasikan).
Apa yang bisa menjelaskan hal ini (mengingat besarnya efek yang saya amati)? Apakah karena lebih mudah melakukan resampling untuk mendapatkan varians yang lebih ekstrem daripada yang diamati relatif terhadap ekstremitas rata-rata pada saat resampling? Mungkinkah ini merupakan cerminan dari data yang telah dipijat / dipilih secara selektif? Apakah pendekatan resampling ini sama dengan bootstrap? Jika tidak, apa lagi yang harus dilakukan untuk menghasilkan CI?