Saya sangat baru dalam pemrograman GPGPU jadi tolong maafkan saya jika pertanyaannya tidak tepat. Dari apa yang saya pahami pemrograman GPU adalah bagian yang sangat rumit dari pekerjaan teknik jika dibandingkan dengan pemrograman CPU biasa. Kita harus sangat berhati-hati tentang masalah divergensi, ubin, alokasi memori yang disematkan, dan komunikasi perangkat / komputasi perangkat yang tumpang tindih.
Setelah melakukan sedikit penelitian saya menemukan perpustakaan dorong yang tampaknya mencoba meniru C ++ STL. Ini cukup bagus. Namun, berdasarkan pengalaman saya yang sangat terbatas dan setelah melihat semua manajemen mikro diperlukan untuk mendapatkan kinerja yang baik, saya sedikit skeptis tentang kinerja tersebut. Dapatkah dorong efisien menangani semua bagian pemrograman yang rumit secara internal? Beberapa perpustakaan yang sangat terkenal, seperti PETSc, tampaknya menggunakan paket ini yang membuat saya percaya seharusnya.
Saya bertanya-tanya apakah orang-orang dengan pengalaman lebih pada CUDA dan dorong bisa mengatakan satu atau dua kata tentang kinerja paket jika dibandingkan dengan pemrograman CUDA tingkat rendah. Kapan saya bisa menggunakan dorongan dan kapan saya harus kembali ke CUDA?