Katakanlah saya memiliki dua kondisi, dan ukuran sampel saya untuk kedua kondisi sangat rendah. Katakanlah saya hanya memiliki 14 pengamatan pada kondisi pertama dan 11 pengamatan lainnya. Saya ingin menggunakan uji-t untuk menguji apakah perbedaan rata-rata secara signifikan berbeda satu sama lain.
Pertama, saya agak bingung tentang asumsi normal dari uji-t, yang mungkin mengapa saya tidak sepenuhnya mendapatkan bootstrap. Apakah asumsi untuk uji-t bahwa (A) data sampel dari populasi normal, atau (B) bahwa distribusi sampel Anda memiliki sifat Gaussian? Jika itu (B) maka itu bukan asumsi, kan? Anda bisa saja memetakan histogram data Anda dan melihat apakah itu normal atau tidak. Jika ukuran sampel saya rendah, saya tidak akan memiliki cukup data poin untuk melihat apakah distribusi sampel saya normal.
Di sinilah saya pikir bootstrap masuk. Saya bisa bootstrap untuk melihat apakah sampel saya normal, kan? Pada awalnya saya berpikir bahwa bootstrap akan selalu menghasilkan distribusi normal, tetapi ini tidak terjadi ( Dapatkah Bootstrap Resampling digunakan untuk Menghitung Interval Keyakinan untuk Varians dari Set Data? Statexchange statexchange ). Jadi, salah satu alasan Anda melakukan bootstrap adalah untuk lebih memastikan normalitas data sampel Anda, benar?
Pada titik ini saya menjadi sangat bingung. Jika saya melakukan uji-t di R dengan fungsi t.test dan saya menaruh vektor sampel yang di-boot sebagai dua sampel independen, nilai t saya menjadi sangat signifikan. Apakah saya tidak melakukan uji-t bootstrap kan? Saya tidak boleh, karena semua bootstrap lakukan hanya membuat nilai t saya lebih besar, bukankah ini terjadi dalam setiap kasus? Apakah orang tidak melakukan uji-t pada sampel yang di-bootstrap?
Terakhir, apa manfaat dari interval kepercayaan komputasi pada bootstrap dibandingkan dengan interval kepercayaan komputasi pada sampel asli kami? Apa yang dikatakan interval kepercayaan ini bahwa interval kepercayaan pada data sampel asli tidak?
Saya kira saya bingung pada (A) mengapa menggunakan bootstrap jika itu hanya akan membuat nilai t saya lebih signifikan, (B) tidak yakin tentang cara yang benar untuk menggunakan bootstrap ketika menjalankan uji-t sampel independen, dan (C) tidak yakin bagaimana melaporkan justifikasi, eksekusi, dan hasil bootstrap dalam situasi uji-t independen.