Saya cukup baru untuk PostgreSQL, saya belum pernah melakukan penyebaran besar menggunakannya sebelumnya. Tetapi, saya memiliki pengalaman yang baik dalam solusi perusahaan dan saya ingin mencoba dan menerapkan beberapa dari apa yang saya pelajari menggunakan PostgreSQL.
Saya memiliki situs yang berukuran untuk menangani sejumlah besar data dan lalu lintas. Infrastruktur akan dibangun menggunakan amazon (AWS) menggunakan instance EC2 dan volume EBS.
Desain harus memiliki dua database, basis data transaksional utama dan gudang data untuk menangani analisis dan pelaporan.
Basis data transaksional utama
akan digunakan untuk situs web langsung, situs ini dibangun di atas beberapa node untuk meningkatkan pengguna secara bersamaan. Terutama kami membutuhkan database untuk kasus ini sangat cepat dalam operasi membaca, kami mengharapkan data> 100GB dengan pertumbuhan tahunan 30%. Pada titik ini, kami berencana untuk menggunakan dua server EC2 ( dan menambahkan lebih banyak lagi sesuai kebutuhan ).
pertanyaan saya, pengaturan apa yang disarankan untuk persyaratan di atas? Plus, apakah ada cara untuk mengatur partisi tabel dan volume? apakah ada rekomendasi untuk menggunakan pengaturan AWS?
Database gudang data
Akan digunakan terutama untuk menangkap semua data dari database transaksional utama dalam dimensi waktu. jadi, bahkan catatan yang dihapus dari basis data utama akan ditangkap dalam DWH. Oleh karena itu, data akan sangat besar dan pertumbuhan akan semakin besar. Kami juga akan menggunakan instance EC2 pasangan atau lebih jika diperlukan.
Apa pengaturan yang disarankan dalam kasus ini? ini akan membutuhkan operasi penulisan cepat karena penulisan konstan (ETL). Bisakah kita membuat kubus OLAP di PostgreSQL? jika ya, apakah ada orang di luar sana yang mencobanya?
Menghubungkan ke database
Server web akan terhubung ke database utama untuk meminta dan menulis. Kami sedang mengembangkan aplikasi menggunakan Django yang menggunakan pustaka asli untuk menghubungkan. Apakah disarankan untuk menggunakan metode dasar yang sama? atau haruskah kita mengkonfigurasi pgpool?
Gudang data (ETL)
Apa cara yang disarankan untuk membangun proses ETL untuk membaca dari main dan memuat ke data warehouse? Ada alat? metodologi untuk diikuti? apakah PostgreSQL menawarkan fungsi / alat bantu dalam membangun proses ETL?