Saya tidak yakin apakah konsultan eksternal akan menjadi dukungan yang lebih baik untuk perusahaan Anda jika Anda akan menangani kumpulan data yang sangat besar dan Anda harus mulai dari awal. Tolong jangan salah paham, tetapi jika salah satu proyek gagal dengan begitu banyak pelanggan, itu akan berdampak PR pada perusahaan Anda.
Mengenai 10M tupel dalam satu tabel, jika Anda memiliki pengindeksan yang baik itu akan baik-baik saja. Kita perlu menyimpan beberapa tuple 100 juta dalam satu tabel di sini (barang yang dijual) yang berfungsi dengan baik pada oracle 11g yang besar
Berikut ini adalah posting dari 2010 dengan peta desain db Facebooks : desain database Facebook
Anda mungkin ingin membaca dokumentasi mysql tentang tipe partisi seperti ini: Dokumentasi MySQL: Partinioning
MySQL mendukung tipe-tipe ini:
Partisi RANGE . Jenis partisi ini memberikan baris ke partisi berdasarkan nilai kolom yang berada dalam rentang tertentu. Lihat Bagian 18.2.1, “RANGE Partitioning”.
DAFTAR partisi. Mirip dengan mempartisi oleh RANGE, kecuali bahwa partisi tersebut dipilih berdasarkan kolom yang cocok dengan salah satu dari set nilai diskrit. Lihat Bagian 18.2.2, “LIST Partitioning”.
Partisi HASH . Dengan jenis partisi ini, partisi dipilih berdasarkan nilai yang dikembalikan oleh ekspresi yang ditentukan pengguna yang beroperasi pada nilai kolom dalam baris yang akan dimasukkan ke dalam tabel. Fungsi ini dapat terdiri dari ekspresi apa pun yang valid di MySQL yang menghasilkan nilai integer non-negatif. Ekstensi untuk jenis ini, LINEAR HASH, juga tersedia. Lihat Bagian 18.2.3, “Partisi HASH”.
Partisi kunci . Jenis partisi ini mirip dengan partisi oleh HASH, kecuali bahwa hanya satu atau lebih kolom yang dievaluasi disediakan, dan server MySQL menyediakan fungsi hashing sendiri. Kolom ini dapat berisi selain nilai integer, karena fungsi hashing yang disediakan oleh MySQL menjamin hasil integer terlepas dari tipe data kolom. Ekstensi untuk jenis ini, LINEAR KEY, juga tersedia. Lihat Bagian 18.2.4, “KUNCI Partisi”.
I can't believe they would have one global user table with 950 million entries.
Aku bisa, yang tidak yang besar. Saya telah bekerja dengan tabel yang lebih besar. Ini cukup umum. Opsi lain yang akan saya pertimbangkan jika Anda memiliki banyak data lain adalah database NoSQL .