Anda akan mendapatkan jawaban yang jauh lebih baik jika Anda memberikan beberapa rincian teknis lebih lanjut tentang jenis data apa yang Anda coba letakkan di bawah kontrol versi, bagaimana Anda ingin menyimpan versi data yang berbeda, komponen apa yang cenderung berubah dan komponen apa yang tidak, dan apakah Anda benar-benar akan memiliki sejarah seperti pohon (cabang, gabungan).
File HDF5 tidak cocok untuk kontrol versi berbasis-diff di bawah git.
git menggunakan basis data berbasis hash di bawah tenda, sehingga dimungkinkan untuk menyimpan hash dari file data HDF5 Anda tanpa benar-benar menyimpan file itu sendiri. Tiga proyek, git-fat , git-annex dan git-media , sangat menyederhanakan proses ini untuk Anda. Saya akan menyarankan menggunakan pendekatan ini jika Anda memiliki data yang besar dan sepenuhnya independen yang ingin Anda versi secara eksplisit.
Jika Anda dapat memisahkan penyimpanan data Anda menjadi wilayah yang tidak mudah menguap dan tidak stabil, ini akan sangat meningkatkan efisiensi interaksi Anda dengan basis data kontrol versi. Anda mungkin juga ingin mempertimbangkan untuk secara eksplisit menggunakan database untuk data Anda jika Anda tidak memerlukan fitur DVCS yang ditawarkan git.