Model paralel teoretis mana yang paling dekat dengan model pemrograman CUDA / OpenCL?
Misalnya, ini cocok pada tingkat tertentu dengan model Mesin Akses Acak Paralel (PRAM) generik. Namun, itu terlalu umum, karena membuat abstraksi dari berbagai latensi akses memori dan masalah sinkronisasi.
Pertanyaan saya adalah model teoretis mana yang paling cocok dengan arsitektur CUDA (mengingat paralelisme hierarki threads dan blok-blok thread yang bekerja sama)?