Bisakah kita menggunakan sampel bootstrap yang lebih kecil dari sampel asli?


12

Saya ingin menggunakan bootstrap untuk memperkirakan interval kepercayaan untuk estimasi parameter dari dataset panel dengan N = 250 perusahaan dan T = 50 bulan. Estimasi parameter mahal secara komputasi (beberapa hari perhitungan) karena penggunaan penyaringan Kalman dan estimasi nonlinier kompleks. Oleh karena itu, menggambar (dengan penggantian) B (dalam ratusan atau lebih) sampel M = N = 250 perusahaan dari sampel asli dan memperkirakan parameter B kali tidak layak secara komputasi, meskipun ini adalah metode dasar untuk bootstrap.

Jadi saya sedang mempertimbangkan untuk menggunakan M yang lebih kecil (misalnya 10) untuk sampel bootstrap (daripada ukuran penuh N = 250), diambil secara acak dengan penggantian dari perusahaan asli, dan kemudian skala matriks kovarians estimasi bootstrap parameter model dengan 1NM (dalam contoh di atas dengan 1/25) untuk menghitung matriks kovarians untuk parameter model yang diestimasi pada sampel lengkap.

Interval kepercayaan yang diinginkan kemudian dapat diperkirakan berdasarkan asumsi normalitas, atau yang empiris untuk sampel yang lebih kecil diskalakan menggunakan prosedur yang sama (misalnya diperkecil oleh faktor 1NM .

Apakah solusi ini masuk akal? Apakah ada hasil teoritis untuk membenarkan hal ini? Adakah alternatif untuk mengatasi tantangan ini?

Jawaban:


4

MNMN

1N(TNμ)X1,,XNμTN=1Ni=1NXiμ=E(X1)

N{x1,,xN}μ^N=TN(x1,,xN)

(1)N(TN(X1,,XN)μ^N)DN(TN(X1,,XN)μ)
XiXi{x1,,xN}

M<N

(2)M(TM(X1,,XM)μ^N).
M,N2112MN

M,NM MN

μ^NDμN

(3)N(TN(X1,,XN)μ),
mnm=Nn=3MNM<NNN) jenis. Bonus tambahan dalam kasus Anda adalah bahwa lebih murah untuk mengevaluasi secara komputasi.

MN

Sumber :

n

mmn


3

Setelah membaca lebih lanjut tentang topik tersebut, tampaknya ada teori yang ditetapkan di bawah "sub-sampling" yang memungkinkan untuk melakukan estimasi interval kepercayaan jenis ini. Referensi utama adalah "Politis, DN; Romano, JP (1994). Daerah kepercayaan sampel besar berdasarkan sub-sampel di bawah asumsi minimal. Annals of Statistics, 22, 2031-2050."

Idenya adalah untuk menggambar sampel ukuran M <N, "tanpa penggantian" untuk setiap sampel (tetapi dengan penggantian di berbagai sampel ukuran B), dari titik data awal N (seri dalam kasus saya), dan memperkirakan interval kepercayaan dari parameter yang menarik menggunakan sampel ini dan metode bootstrap umum. Kemudian skala interval kepercayaan berdasarkan pada tingkat perubahan dalam varian distribusi yang mendasari parameter dengan perubahan dalam M. Tingkat itu adalah 1 / M dalam banyak pengaturan umum, tetapi dapat secara empiris diperkirakan jika kita mengulangi prosedur dengan beberapa M berbeda. nilai dan lihat perubahan ukuran rentang antar-persentil.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.