Mari kita menggeneralisasi, sehingga fokus pada inti masalah. Saya akan menguraikan detail terkecil sehingga tidak meninggalkan keraguan. Analisis hanya memerlukan yang berikut ini:
The mean aritmetik dari himpunan bilangan didefinisikan sebagaiz1,…,zm
1m(z1+⋯+zm).
Ekspektasi adalah operator linier. Yaitu, ketika adalah variabel acak dan α i adalah angka, maka ekspektasi dari kombinasi linear adalah kombinasi linear dari ekspektasi,Zi,i=1,…,mαi
E(α1Z1+⋯+αmZm)=α1E(Z1)+⋯+αmE(Zm).
Biarkan menjadi sampel ( B 1 , ... , B k ) yang diperoleh dari dataset x = ( x 1 , ... , x n ) dengan mengambil elemen k secara seragam dari x dengan penggantian. Mari m ( B ) menjadi mean aritmetik dari B . Ini adalah variabel acak. KemudianB(B1,…,Bk)x=(x1,…,xn)kxm(B)B
E(m(B))=E(1k(B1+⋯+Bk))=1k(E(B1)+⋯+E(Bk))
diikuti oleh linearitas harapan. Karena unsur-unsur semuanya diperoleh dengan cara yang sama, mereka semua memiliki harapan yang sama, b katakan:Bb
E(B1)=⋯=E(Bk)=b.
Ini menyederhanakan hal sebelumnya
E(m(B))=1k(b+b+⋯+b)=1k(kb)=b.
Menurut definisi, ekspektasi adalah jumlah nilai tertimbang-probabilitas. Karena setiap nilai diasumsikan memiliki peluang yang sama dengan 1 / n dipilih,X1/n
E(m(B))=b=E(B1)=1nx1+⋯+1nxn=1n(x1+⋯+xn)=x¯,
rata-rata aritmatika data.
x¯k=nx¯
Untuk statistik yang bukan fungsi linier data, hasil yang sama tidak selalu berlaku. Namun, itu akan salah hanya dengan mengganti rata-rata bootstrap untuk nilai statistik pada data: itu bukan cara kerja bootstrap. Sebagai gantinya, dengan membandingkan rata-rata bootstrap dengan statistik data, kami memperoleh informasi tentang bias statistik. Ini dapat digunakan untuk menyesuaikan statistik asli untuk menghapus bias. Karenanya, estimasi yang dikoreksi bias menjadi kombinasi aljabar dari statistik asli dan rata-rata bootstrap. Untuk informasi lebih lanjut, lihat "BCa" (bootstrap yang dikoreksi dan dipercepat) dan "ABC". Wikipedia menyediakan beberapa referensi.