Apakah mungkin untuk memberikan perkiraan praktis tentang ukuran jaringan saraf yang dapat dilatih pada GPU kelas konsumen umum ? Sebagai contoh:
The Emergence of Locomotion (Reinforcement) kertas melatih jaringan menggunakan aktivasi tanh dari neuron. Mereka memiliki 3 lapisan NN dengan 300.200 unit untuk Planar Walker . Tetapi mereka tidak melaporkan perangkat keras dan waktu ...
Tapi bisakah aturan praktis dikembangkan? Juga hanya berdasarkan hasil empiris saat ini, jadi misalnya:
X Unit menggunakan aktivasi sigmoid dapat menjalankan iterasi pembelajaran Y per jam pada 1060.
Atau menggunakan fungsi aktivasi a bukannya b menyebabkan penurunan kinerja kali.
Jika seorang siswa / peneliti / penasaran ingin membeli GPU untuk bermain-main dengan jaringan ini, bagaimana Anda memutuskan apa yang Anda dapatkan? A 1060 tampaknya adalah opsi anggaran level awal, tetapi bagaimana Anda bisa mengevaluasi jika tidak pintar untuk hanya mendapatkan netbook jelek daripada membangun desktop berdaya tinggi dan menghabiskan $ yang dihemat untuk infrastruktur cloud on-demand.
Motivasi untuk pertanyaan: Saya baru saja membeli 1060 dan (pintar, untuk menanyakan pertanyaan setelah itu ya) bertanya-tanya apakah saya seharusnya hanya menyimpan $ dan membuat akun Google Cloud. Dan jika saya dapat menjalankan simulasi tesis master saya pada GPU.