The kertas pada Gans mengatakan diskriminator menggunakan gradien berikut untuk kereta:
The nilai-nilai yang sampel, melewati generator untuk menghasilkan sampel data, dan kemudian diskriminator yang backpropogated menggunakan sampel data yang dihasilkan. Setelah generator menghasilkan data, generator tidak lagi berperan dalam pelatihan diskriminator. Dengan kata lain, generator dapat sepenuhnya dihapus dari metrik dengan membuatnya menghasilkan sampel data dan kemudian hanya bekerja dengan sampel.
Saya sedikit lebih bingung tentang bagaimana generator dilatih. Ini menggunakan gradien berikut:
Dalam hal ini, pembeda adalah bagian dari metrik. Itu tidak bisa dihapus seperti kasus sebelumnya. Hal-hal seperti kuadrat terkecil atau log kemungkinan dalam model diskriminatif biasa dapat dengan mudah dibedakan karena mereka memiliki definisi yang bagus, bentuknya dekat. Namun, saya agak bingung tentang bagaimana Anda melakukan backpropogate ketika metrik tergantung pada jaringan saraf lain. Apakah Anda pada dasarnya melampirkan output generator ke input diskriminator dan kemudian memperlakukan semuanya seperti satu jaringan raksasa di mana bobot dalam porsi diskriminator konstan?
D_lossdanG_loss? Memaksimalkan ruang apa? IIUC,D_realdanD_fakemasing-masing batch, jadi kami memaksimalkan batch ??