Sampel bootstrap digunakan untuk mengevaluasi kinerja algoritma oleh banyak iterasi. Saat melakukannya, kinerja pada set yang diubah secara acak dievaluasi.
Sebaliknya saat melakukan, misalnya 10 Validasi Silang Lipat, Anda hanya melakukan 10 iterasi pada rangkaian data tes dan kereta yang berbeda.
n = 20i = 10 , 000
Tautan yang Anda kirim sudah rusak, jadi saya menambahkan deskripsi fungsi di versi sklearn saat ini (0,14)
Deskripsi metode
Pengambilan sampel acak dengan penggantian-validasi silang iterator Menyediakan indeks kereta / tes untuk membagi data dalam rangkaian tes kereta api saat melakukan resampling pada input n_iter kali: setiap kali pemisahan acak baru dilakukan dan kemudian sampel diambil (dengan penggantian) pada setiap sisi split untuk membangun pelatihan dan set tes. Catatan: bertentangan dengan strategi validasi silang lainnya, bootstrap akan memungkinkan beberapa sampel terjadi beberapa kali di setiap pemisahan. Namun sampel yang terjadi di split kereta tidak akan pernah terjadi di split tes dan sebaliknya. Jika Anda ingin setiap sampel muncul paling banyak satu kali, Anda mungkin harus menggunakan validasi silang ShuffleSplit sebagai gantinya.