Bagging adalah proses menciptakan N pelajar pada N sampel bootstrap yang berbeda, kemudian mengambil rata-rata prediksi mereka.
Pertanyaan saya adalah: Mengapa tidak menggunakan jenis sampling lainnya? Mengapa menggunakan sampel bootstrap?
Bagging adalah proses menciptakan N pelajar pada N sampel bootstrap yang berbeda, kemudian mengambil rata-rata prediksi mereka.
Pertanyaan saya adalah: Mengapa tidak menggunakan jenis sampling lainnya? Mengapa menggunakan sampel bootstrap?
Jawaban:
Pertanyaan menarik. Bootstrap memiliki properti sampling yang baik, dibandingkan dengan beberapa alternatif seperti jackknife. Kelemahan utama dari bootstrap adalah bahwa setiap iterasi harus bekerja dengan sampel yang sebesar set data asli (yang bisa mahal secara komputasi), sementara beberapa teknik pengambilan sampel lainnya dapat bekerja dengan sampel yang jauh lebih kecil.
Makalah ini menunjukkan bahwa memotong ukuran sampel secara naif dapat mengurangi kinerja, relatif terhadap pengemasan berbasis bootstrap, yang akan menjadi alasan untuk tidak melakukannya. Makalah ini juga memperkenalkan metode baru untuk menggunakan sampel yang lebih kecil dalam perkiraan kantong, sambil menghindari masalah tersebut.