Untuk memasukkan pertanyaan saya ke dalam konteks, saya seorang fisikawan tetapi dengan paparan statistik yang terbatas dan apa yang telah saya pelajari tentang hal itu lebih dari 30 tahun yang lalu.
Saya mencoba mempelajari tentang blok bootstrap karena teknik itu mungkin cocok untuk menyelesaikan masalah yang sedang saya kerjakan. Saya dapat menemukan banyak makalah / buku / info tentang matematika bootstrap blok tapi saya ingin menemukan dulu deskripsi umum dari proses bootstrap blok sebelum 'berkelana' menjadi masalah seperti memindahkan blok bootstrap, bootstrapping blok melingkar, bootstrapping blok melingkar, bootstapping blok stasioner, , panjang blok, sampel, dll.
Saya memiliki data berkorelasi berlebihan, 5 variabel (kolom) dengan 10.000 pengamatan (baris) yang ingin saya kurangi menjadi sekitar 100 baris data. Data adalah deret waktu, tetapi tidak kontinu dan mungkin ada data dari lokasi yang berbeda di dalamnya juga, yang berarti Anda dapat memiliki data yang berbeda pada saat yang sama (jika yang terakhir adalah masalah untuk blok bootstrap, saya bisa menghapus data 'duplikat' pada waktunya). Blok bootstrap memungkinkan untuk mereplikasi korelasi data.
Tujuan utamanya adalah untuk mengurangi dataset hingga ~ 100 baris data sehingga pdf dan cdf dari dataset lengkap dan dataset yang dikurangi adalah sama (dalam rentang kesalahan minimum yang masih harus didefinisikan) untuk semua 5 variabel.
Pertanyaan: 1) Apakah memblokir bootstrap dapat melakukan ini? 2) Apa proses langkah demi langkah yang dilakukan? Saya tidak mengharapkan siapa pun untuk menulis proses lengkap secara rinci di sini, tetapi mungkin seseorang telah meletakkan video youtube atau 'bootstrap for dummies' di luar sana yang bisa saya mulai.
Saya telah melihat pertanyaan serupa tentang blok bootstrap di sini dan ada satu di "Sumberdaya untuk belajar tentang blok bootstrap dalam analisis deret waktu", tetapi referensi dalam jawaban mengasumsikan literasi statistik yang masih harus saya kuasai.