Saya mencoba memahami bagaimana metode pengoptimalan berbasis adjoint bekerja untuk optimisasi terbatas PDE. Khususnya, saya mencoba memahami mengapa metode adjoint lebih efisien untuk masalah di mana jumlah variabel desain besar, tetapi "jumlah persamaan kecil".
Apa yang saya mengerti:
Pertimbangkan masalah pengoptimalan terbatas PDE berikut:
di mana adalah fungsi objektif (cukup kontinu) dari variabel desain vektor dan vektor variabel lapangan tidak diketahui yang bergantung pada variabel desain, dan adalah bentuk residu dari PDE.
Jelas, kita dapat variasi pertama dari I dan R sebagai
Memperkenalkan vektor pengganda lagrange , variasi dalam fungsi tujuan dapat ditulis sebagai
Menyusun ulang istilah, kita dapat menulis:
Dengan demikian, jika kita dapat menyelesaikan untuk sehingga
Kemudian gradien dievaluasi hanya dalam hal variabel desain .
Dengan demikian, algoritma optimisasi berbasis adjoint akan mengulangi langkah-langkah berikut:
- Diberikan variabel desain saat ini
- Memecahkan variabel bidang (dari PDE)
- Memecahkan untuk pengganda lagrange (dari persamaan adjoint)
- Hitung gradien
- Perbarui variabel desain
Pertanyaan saya
Bagaimana 'trik' adjoin ini meningkatkan biaya optimasi per iterasi dalam kasus di mana jumlah variabel desain besar? Saya pernah mendengar bahwa biaya evaluasi gradien untuk metode adjoint adalah 'independen' dari jumlah variabel desain. Tetapi bagaimana tepatnya ini benar?
Saya yakin ada sesuatu yang sangat jelas bahwa saya entah bagaimana menghadap.