Ini tidak mungkin menambah banyak di luar upaya pengumpulan data langsung Anda.
Kualitas keluaran GAN saat ini (per 2017) tidak akan cukup tinggi. Gambar yang dihasilkan oleh GAN biasanya kecil dan dapat memiliki detail yang tidak biasa / ambigu dan distorsi aneh. Dalam kertas Anda terhubung, gambar yang dihasilkan oleh sistem dari sebuah kalimat memiliki blok dipercaya warna diberikan materi pelajaran, tapi tanpa kalimat priming Anda apa yang diharapkan sebagian besar dari mereka tidak dikenali sebagai setiap subjek tertentu.
GAN dengan tujuan yang kurang ambisius daripada menghasilkan gambar dari kalimat (yang meskipun ada kritik di atas, IMO yang benar-benar luar biasa) harus menghasilkan gambar yang lebih dekat dengan foto yang realistis. Tetapi ruang lingkup mereka akan lebih sedikit dan mungkin tidak termasuk jenis gambar yang Anda inginkan. Juga, biasanya ukuran keluarannya kecil, misalnya 64x64 atau 128x128 *, dan masih ada cukup distorsi dan ambiguitas sehingga foto-foto ground ground asli akan jauh lebih disukai.
GAN sendiri dibatasi oleh perpustakaan pelatihan yang tersedia - GAN tidak akan berhasil jika Anda mencoba untuk menghasilkan gambar di luar ruang lingkup data pelatihannya. Hasil yang ditunjukkan dalam makalah penelitian tentu saja fokus pada domain yang disediakan oleh data pelatihan. Tetapi Anda tidak bisa hanya memasukkan kalimat apa pun ke dalam model ini dan mengharapkan hasil yang akan berguna di tempat lain.
Jika Anda menemukan GAN yang telah dilatih tentang kumpulan data yang sesuai untuk masalah Anda, maka kemungkinan besar Anda lebih baik mencoba untuk sumber data yang sama secara langsung untuk proyek Anda.
Jika Anda menghadapi masalah dengan data ground truth yang terbatas, maka mungkin pendekatan yang lebih baik untuk menggunakan GAN adalah dengan menggunakan classifier pra-terlatih seperti VGG-19 atau Inception v5, ganti beberapa layer terakhir yang terkoneksi penuh, dan fine tune di data Anda. Berikut adalah contoh melakukan hal itu menggunakan Keras library di Python - contoh lain dapat ditemukan dengan pencarian seperti "fine tune CNN image classifier".
* GAN canggih telah menjadi lebih baik sejak saya memposting jawaban ini. Sebuah tim peneliti di Nvidia telah sukses luar biasa dalam menciptakan gambar realistis-foto 1024x1024 . Namun, ini tidak mengubah poin lain dalam jawaban saya. GAN bukan sumber gambar yang dapat diandalkan untuk tugas klasifikasi gambar, kecuali mungkin untuk sub-tugas dari apa pun yang telah dilatih oleh GAN dan mampu menghasilkan secara kondisional (atau mungkin lebih sepele, untuk menyediakan data sumber untuk kategori "lainnya" di pengklasifikasi).