Kami baru memulai desain untuk gudang data baru dan kami mencoba merancang bagaimana dimensi tanggal dan waktu kami akan bekerja. Kami harus dapat mendukung beberapa zona waktu (mungkin setidaknya GMT, IST, PST, dan EST). Kami awalnya berpikir bahwa kami akan memiliki satu dimensi waktu tanggal gabungan yang luas hingga mungkin 15 menit, dengan begitu kami memiliki satu kunci dalam tabel fakta kami dan semua data waktu tanggal yang berbeda untuk semua zona waktu yang didukung berada dalam tabel satu dimensi. (yaitu Kunci Tanggal, Tanggal GMT, Waktu GMT, Tanggal IST, Waktu IST, dll ...)
Kimball menyarankan untuk memiliki dimensi hari yang terpisah dari dimensi hari untuk mencegah tabel tumbuh terlalu besar (Toolkit data warehouse hal. 240) yang kedengarannya baik namun itu berarti kita memiliki dua kunci dalam tabel fakta untuk setiap zona waktu kita perlu mendukung (satu untuk tanggal dan satu untuk waktu hari).
Karena saya sangat tidak berpengalaman dalam bidang ini, saya berharap seseorang di luar sana tahu pertukaran antara kedua pendekatan, yaitu kinerja vs. pengelolaan semua kunci zona waktu yang berbeda. Mungkin ada pendekatan lain juga, saya telah melihat beberapa orang berbicara tentang memiliki baris terpisah di tabel fakta per zona waktu, tapi itu sepertinya masalah jika tabel fakta Anda adalah jutaan baris maka Anda perlu melipatgandakannya untuk menambah zona waktu .
Jika kita melakukan butiran 15 menit, kita akan memiliki baris 131.400 (24 * 15 * 365) per tahun dalam tabel dimensi waktu tanggal kita yang kedengarannya tidak terlalu mengerikan untuk kinerja tetapi kita tidak akan tahu pasti sampai kita menguji beberapa pertanyaan prototipe. Kekhawatiran lain dengan memiliki kunci zona waktu yang terpisah di tabel fakta adalah bahwa kueri harus bergabung dengan tabel dimensi ke kolom berbeda berdasarkan zona waktu yang diinginkan, mungkin ini adalah sesuatu yang SSAS urus untuk Anda, saya tidak yakin .
terima kasih atas pemikiran, -Matt