Bayangkan kebutuhan Anda adalah bahwa Anda memiliki 3 tabel besar (data terstruktur) dengan katakanlah 30 miliar baris di masing-masing (ukuran total 4TB) dan banyak pengguna secara bersamaan (yang merupakan thread paralel atau os pada mesin LAN jarak jauh) perlu membaca sebagian dari data melalui permintaan SELELCT WHERE GROUPBY mereka dan sangat bersamaan, katakanlah 10.000 bersamaan berbunyi pada saat yang sama dan juga pengguna perlu memasukkan (tidak ada pembaruan) data ke dalam tabel ini yang sangat bersamaan juga seperti 2000 penulis bersamaan (di seluruh pusat data jaringan LAN) . Para pengguna ingin membaca dan menyisipkan secepat mungkin dari penyimpanan ini di mana setiap membaca dan menulis akan terjadi dalam rentang ms hingga 1 detik.
Teknologi apa yang Anda rekomendasikan untuk memenuhi persyaratan seperti itu? Apakah ada penyimpanan data atau penyimpanan nilai kunci yang bisa melakukan ini? Cloud BUKAN pilihan.
Beberapa Klarifikasi:
Para pengguna TIDAK harus melihat data segera dan akhirnya konsistensi dapat diterima. Data diakses melalui driver apa pun yang dapat disediakan oleh penyimpanan dan pengguna hanya menjalankan utas pada mesin jarak jauh dari pusat data. Pertanyaannya kebanyakan seperti SELECT WHERE GROUPBY.
Data dalam format tabel dan setiap baris sekitar 60 byte.
Tidak ada opsi cloud di mana saya tidak dapat menggunakan DynamoDB atau solusi serupa. Saya harus dapat meng-host-nya secara internal di pusat data.
Semua data dari tabel dapat dibaca sepanjang waktu dan pola penggunaan tidak dapat diprediksi. Tidak ada permintaan bergabung atau super panjang. Tidak diperlukan DR tetapi HA yang wajar diperlukan tetapi tidak harus mewah. Setiap pembaca mendapatkan kumpulan baris berdasarkan klausa dan barisnya yang tidak benar-benar terkait. Kita mungkin dapat memiliki panjang yang diperbaiki untuk setiap baris tetapi saya berharap lapisan penyimpanan akan mengkhawatirkannya.
Juga, perhatian terbesar saya adalah semua penulisan bersamaan yang terjadi dengan pembacaan bersamaan.
Wawasan Anda tentang hal ini sangat dihargai.
Dan lebih dari itu, saya memiliki tiga tabel tersebut dengan masing-masing 30 miliar baris memegang jenis objek yang berbeda