Pertimbangkan persamaan diferensial berikut mana adalah status dan sebagai variabel kontrol. Solusi diberikan oleh mana adalah status inital yang diberikan.
Sekarang pertimbangkan program berikut mana \ rho> 0 menunjukkan preferensi waktu, V (\ cdot) adalah nilainya dan F (\ cdot) fungsi obyektif. Aplikasi ekonomi klasik adalah model pertumbuhan optimal Ramsey-Cass-Koopmans. Persamaan Hamilton-Jacobi-Bellman diberikan oleh \ begin {align} \ rho V (x) = \ max_u [F (x, u) + V '(x) f (x, u)], \ quad \ forall t \ in [0, \ infty). \ end {align}
Katakanlah saya sudah memecahkan HJB untuk . Kontrol optimal kemudian diberikan oleh
The wiki Artikel mengatakan
... tetapi ketika diselesaikan di seluruh ruang keadaan, persamaan HJB adalah kondisi yang diperlukan dan cukup untuk optimal.
Dalam Bertsekas (2005) Dinamis Pemrograman dan Kontrol Optimal , Vol 1, 3rd ed., Di Proposisi 3.2.1 ia menyatakan bahwa pemecahan untuk adalah optimal fungsi biaya-to-go dan terkait optimal. Namun, ia secara eksplisit menyatakannya sebagai teorema kecukupan.
Sebenarnya, saya hanya ingin memastikan, bahwa jika saya telah memecahkan HJB dan memulihkan keadaan terkait dan mengontrol lintasan, bahwa saya tidak perlu khawatir dengan kondisi optimalitas tambahan.
Larutan
Saya mencoba
Saya pikir saya bisa mendapatkan kondisi yang diperlukan dari prinsip maksimum dengan persamaan HJB itu sendiri.
Tentukan hamiltonian
maka kita memiliki
yaitu
Tentukan fungsi sembarang dengan . Sekarang perbaiki
di mana adalah parameter. Masukkan istilah ke dalam hamiltonian maksimal yang memberi ρ V ( x ∗ + ε q ) = H ( x ∗ + ε q , u ∗ , V ′ ( x ∗ + ε q ) ) .
Pada kami memiliki solusi optimal. Jadi bedakan dengan untuk mendapatkan kondisi urutan pertama ε ρ V ′ q = H x q + H V ′ V ″ q .
Sekarang tentukan variabel adjoint dengan
Bedakan dari waktu ke waktu
dan perhatikan bahwa
Tancapkan everthing ke foc yang memberikan
Cukup banyak. Jadi penyelesaian HJB memang perlu dan memadai (dihilangkan di sini) untuk optimalitas. Seseorang harus menambahkannya ke wiki. Mungkin menghemat waktu untuk orang-orang yang berpikir tentang masalah seperti itu (tidak akan banyak menurut saya).
Namun kondisi transversalitas hilang.
II Mencoba
Tentukan fungsional hasil
Perhatikan bahwa dengan definisi . Tambahkan Term netral ke pembayaran funtional
Integrasi dengan bagian-bagian dari istilah yang tepat dan hasil rhs
Ganti kembali istilah itu
Tentukan
yang memberi
FOC untuk maksimumJ ε = ∫ ∞ 0 e - ρ t [ H x q + H u p + q ( ˙
Karena dan tidak dibatasi, kita harus memiliki