TL; DR
Saya sarankan menggunakan LIPO. Itu terbukti benar dan terbukti lebih baik daripada pencarian acak murni (PRS). Ini juga sangat sederhana untuk diimplementasikan, dan tidak memiliki hyperparameter. Saya belum melakukan analisis yang membandingkan LIPO dengan BO, tetapi harapan saya adalah bahwa kesederhanaan dan efisiensi LIPO menyiratkan bahwa itu akan melebihi kinerja BO.
(Lihat juga: Apa saja kerugian dari optimasi parameter hyper bayesian? )
Optimasi Bayesian
Metode Bayesian Optimization-type membangun model pengganti proses Gaussian untuk menjelajahi ruang parameter. Gagasan utama adalah bahwa tupel parameter yang lebih dekat bersama-sama akan memiliki nilai fungsi yang sama, sehingga asumsi struktur ko-varians di antara titik memungkinkan algoritma untuk membuat tebakan yang mendidik tentang tupel parameter terbaik apa yang paling layak untuk dicoba berikutnya. Strategi ini membantu mengurangi jumlah evaluasi fungsi; pada kenyataannya, motivasi metode BO adalah untuk menjaga agar evaluasi fungsi serendah mungkin seraya "menggunakan seluruh kerbau" untuk membuat tebakan yang baik tentang titik pengujian berikutnya. Ada angka yang berbeda dari prestasi (peningkatan yang diharapkan, peningkatan kuantil yang diharapkan, probabilitas peningkatan ...) yang digunakan untuk membandingkan poin yang akan dikunjungi berikutnya.
Bandingkan ini dengan sesuatu seperti pencarian kotak, yang tidak akan pernah menggunakan informasi apa pun dari evaluasi fungsi sebelumnya untuk menginformasikan ke mana harus pergi berikutnya.
Kebetulan, ini juga merupakan teknik optimisasi global yang kuat , dan karena itu tidak membuat asumsi tentang cembungnya permukaan. Selain itu, jika fungsinya stokastik (katakanlah, evaluasi memiliki beberapa suara acak yang melekat), ini dapat langsung diperhitungkan dalam model GP.
Di sisi lain, Anda harus mencocokkan setidaknya satu dokter umum di setiap iterasi (atau beberapa, memilih yang "terbaik", atau rata-rata atas alternatif, atau metode Bayesian sepenuhnya). Kemudian, model ini digunakan untuk membuat (mungkin ribuan) prediksi, biasanya dalam bentuk optimasi lokal multistart, dengan pengamatan bahwa jauh lebih murah untuk mengevaluasi fungsi prediksi GP daripada fungsi yang dioptimalkan. Tetapi bahkan dengan overhead komputasi ini, itu cenderung menjadi kasus bahwa bahkan fungsi nonconvex dapat dioptimalkan dengan sejumlah panggilan fungsi yang relatif kecil.
Makalah yang banyak dikutip tentang topik ini adalah Jones et al , "Optimalisasi Global Efisien dari Fungsi Kotak Hitam yang Mahal." Tetapi ada banyak variasi pada ide ini.
Pencarian Acak
Bahkan ketika fungsi biayanya mahal untuk dievaluasi, pencarian acak tetap bisa bermanfaat. Pencarian acak sangat mudah diterapkan. Satu-satunya pilihan bagi seorang peneliti untuk membuat adalah menetapkan p probabilitas bahwa Anda ingin hasil Anda terletak pada q kuantil tertentu ; sisanya dihasilkan secara otomatis menggunakan hasil dari probabilitas dasar.hal q
q= 0,95p = 0,95100 × ( 1 - q) = 5nqn= 0,95n1 - 0,95n. Menyatukan semuanya, kita miliki
1 - qn≥ p⟹n ≥ log( 1 - p )catatan( q)
n ≥ 59
n = 60n = 60
Karena Anda memiliki jaminan probabilistik tentang seberapa bagus hasilnya, itu bisa menjadi alat persuasif untuk meyakinkan atasan Anda bahwa tidak perlu melakukan lebih banyak eksperimen.
LIPO dan variannya
Ini adalah kedatangan yang mengasyikkan yang, jika bukan hal baru , tentu baru bagi saya. Ini hasil dengan bergantian antara menempatkan batas informasi pada fungsi, dan pengambilan sampel dari batas terbaik, dan menggunakan perkiraan kuadratik. Saya masih mengerjakan semua detail, tapi saya pikir ini sangat menjanjikan. Ini adalah artikel blog yang bagus , dan makalahnya adalah Cédric Malherbe dan Nicolas Vayatis " Optimalisasi global fungsi Lipschitz ."