Anda perlu mengetahui model dan vendor CPU di mesin Anda. Setelah Anda memilikinya, Anda dapat melihat di situs web vendor (atau mungkin di Wikipedia) clock rate, jumlah chip / soket, jumlah core per chip, jumlah operasi floating point per siklus, dan lebar vektor dari operasi tersebut . Kemudian, Anda cukup gandakan.
Ambil contoh, prosesor Intel Xeon E5-2680 "Sandy Bridge" di Stampede tempat saya bekerja. Spesifikasi adalah:
- 2.7GHz
- 2 chip / node, 8 core / chip
- 2 instruksi vektor / siklus
- Petunjuk AVX lebar 256-bit (4 operan presisi ganda simultan)
Mengalikannya menghasilkan 345.6 GF / node atau 2.2 PF untuk bagian yang tidak dipercepat dari sistem.
Kami biasanya berpikir dalam hal operasi presisi ganda (64-bit), karena itulah presisi yang diperlukan untuk sebagian besar pengguna kami, tetapi Anda dapat mengulang perhitungan dalam istilah presisi tunggal jika Anda mau. Ini biasanya hanya mengubah faktor terakhir, katakan 8 Jepit SP / instruksi bukan 4 DP Jepit / inst, tetapi bisa sangat berbeda dari itu. GPU yang lebih tua, misalnya, hanya melakukan DP sekitar 1/8 tingkat SP. Jika Anda pernah mengutip angka untuk sistem Anda, Anda harus eksplisit tentang yang Anda gunakan jika tidak presisi ganda karena orang akan menganggap itu nomor, jika tidak.
Juga, jika chip Anda mendukung instruksi FMA (multiply-add-add), dan dapat melakukannya dengan kecepatan penuh, maka kebanyakan orang menghitung ini sebagai 2 operasi floating-point meskipun penghitung kinerja perangkat keras mungkin menghitungnya hanya sebagai satu instruksi.
Terakhir, Anda juga dapat melakukan ini untuk akselerator apa pun yang mungkin ada di sistem Anda (seperti GPU atau Xeon Phi) dan menambahkan kinerja itu ke kinerja CPU untuk mendapatkan total teoritis.