Saya telah meneliti basis data Redshift Amazon sebagai kemungkinan pengganti di masa depan untuk gudang data kami. Pengalaman saya selalu menggunakan pemodelan dimensi dan metode Ralph Kimball, jadi agak aneh melihat Redshift tidak mendukung fitur seperti tipe data serial untuk kolom penambahan otomatis.
Namun, ada posting blog terbaru dari AWS Big Data blog tentang cara mengoptimalkan Redshift untuk skema bintang: https://blogs.aws.amazon.com/bigdata/post/Tx1WZP38ERPGK5K/Optimizing-for-Star-Schemas -dan-Interleaved-Sorting-on-Amazon-Redshift
Pertanyaan saya adalah tentang apa praktik terbaik untuk memuat skema bintang di Redshift? Saya tidak dapat menemukan jawaban ini di dokumentasi Redshift mana pun.
Saya condong ke arah mengimpor file saya dari S3 ke dalam tabel panggung dan kemudian menggunakan SQL untuk melakukan transformasi seperti pencarian dan menghasilkan kunci pengganti sebelum memasukkan ke tabel tujuan.
Apakah ini yang sedang dilakukan orang lain? Apakah ada alat ETL yang bernilai uang untuk membuatnya lebih mudah?