Tanggapan ini mungkin terlambat, tetapi tetap perlu diperhatikan. GPU Ocelot ( di mana saya salah satu kontributor inti ) dapat dikompilasi tanpa driver perangkat CUDA (libcuda.so) diinstal jika Anda ingin menggunakan backend Emulator atau LLVM. Saya telah mendemonstrasikan emulator pada sistem tanpa GPU NVIDIA.
Emulator berupaya dengan setia menerapkan spesifikasi PTX 1.4 dan PTX 2.1 yang mungkin menyertakan fitur yang tidak didukung oleh GPU lama. Penerjemah LLVM mengupayakan terjemahan yang benar dan efisien dari PTX ke x86 yang diharapkan akan membuat CUDA cara yang efektif untuk memprogram CPU multicore serta GPU. -deviceemu
telah menjadi fitur CUDA yang tidak digunakan lagi untuk beberapa waktu, tetapi penerjemah LLVM selalu lebih cepat.
Selain itu, beberapa pemeriksa kebenaran dibangun ke dalam emulator untuk memverifikasi: akses memori yang diselaraskan, akses ke memori bersama disinkronkan dengan benar, dan dereferensi memori global mengakses wilayah memori yang dialokasikan. Kami juga telah menerapkan debugger interaktif baris perintah yang sebagian besar terinspirasi oleh gdb ke langkah tunggal melalui kernel CUDA, menetapkan titik putus dan titik pengawasan, dll. Alat ini secara khusus dikembangkan untuk mempercepat debugging program CUDA; Anda mungkin menganggapnya berguna.
Maaf tentang aspek khusus Linux. Kami telah memulai cabang Windows ( serta port Mac OS X ) tetapi beban teknis sudah cukup besar untuk menekankan pengejaran penelitian kami. Jika ada yang punya waktu dan minat, mereka mungkin ingin membantu kami memberikan dukungan untuk Windows!
Semoga ini membantu.