Saya telah menggunakan HDF5 selama bertahun-tahun, tetapi seiring dengan bertambahnya ukuran dataset, saya mulai mengalami masalah yang sama seperti yang tercantum di sini
http://cyrille.rossant.net/moving-away-hdf5/
Bisakah Anda mengarahkan saya ke format seperti HDF5 dengan - Dukungan yang baik untuk penulisan paralel - Dukungan untuk akses chunked dari matriks besar
Kasus penggunaan khas saya adalah matriks integer 100k x 100k. Saya ingin memilikinya sebagai keseluruhan file dari perspektif logis, tetapi saya harus menulisnya sepotong demi sepotong dengan pekerja paralel.