Saya memiliki aplikasi yang dapat diparalelkan secara sepele tetapi kinerjanya sebagian besar terikat I / O. Aplikasi membaca larik input tunggal yang disimpan dalam file yang biasanya berukuran 2-5 GB (tapi saya berharap angka ini bertambah di masa mendatang). Perhitungan tipikal berlaku operasi yang sama untuk setiap baris atau kolom array itu. Untuk operasi CPU-berat, saya mendapatkan skala yang sangat baik hingga sekitar 100 prosesor, tetapi untuk operasi lebih lambat I / O dan komunikasi terkait (akses NFS) mendominasi dan saya tidak dapat menggunakan lebih dari beberapa prosesor secara efisien.
Apa opsi yang efisien dan portabel (idealnya efisien portable) untuk situasi seperti itu? HDF5 paralel tampaknya menjanjikan. Apakah ada yang punya pengalaman nyata dengan itu?
Apakah MPI-I / O akan menjadi sesuatu yang layak untuk dilihat? Bisakah ini bekerja secara efisien dengan tata letak file yang diberikan, atau apakah saya harus menyesuaikan semuanya?