Untuk nvidia (dan amd dalam hal ini) gpus memori lokal dibagi menjadi bank memori. Setiap bank hanya dapat menangani satu dataset pada satu waktu, jadi jika halfwarp mencoba untuk memuat / menyimpan data dari / ke bank yang sama, akses harus dilakukan secara serial (ini adalah konflik bank). Untuk gt200 gpus ada 16 bank (32 bank untuk fermi), 16 atau 32 bank untuk AMD gpus (57xx atau lebih tinggi: 32, semuanya di bawah: 16)), yang disisipkan dengan granuitas 32bit (jadi byte 0-3 ada di bank 1, 4-7 di bank 2, ..., 64-69 di bank 1 dan seterusnya). Untuk visualisasi yang lebih baik, pada dasarnya terlihat seperti ini:
Bank | 1 | 2 | 3 |...
Address | 0 1 2 3 | 4 5 6 7 | 8 9 10 11 |...
Address | 64 65 66 67 | 68 69 70 71 | 72 73 74 75 |...
...
Jadi jika setiap utas di halfwarp mengakses nilai 32bit berturut-turut, tidak ada konflik bank. Pengecualian dari aturan ini (setiap utas harus mengakses banknya sendiri) disiarkan: Jika semua utas mengakses alamat yang sama, nilainya hanya dibaca sekali dan disiarkan ke semua utas (untuk GT200 harus semua utas di halfwarp mengakses alamat yang sama, iirc fermi dan AMD gpus dapat melakukan ini untuk sejumlah utas yang mengakses nilai yang sama).