Pertanyaan yang diberi tag «data-warehouse»

Sistem basis data yang dioptimalkan untuk pelaporan, khususnya dalam agregat. Seringkali, tetapi tidak selalu diimplementasikan menggunakan skema bintang.

5
Apa sajakah cara untuk menerapkan hubungan banyak ke banyak dalam data warehouse?
Topologi dominan pemodelan Data Warehouse (Star, Snowflake) dirancang dengan hubungan satu ke banyak. Keterbacaan permintaan, kinerja, dan struktur sangat menurun ketika dihadapkan dengan hubungan banyak ke banyak dalam skema pemodelan ini. Apa sajakah cara untuk menerapkan hubungan banyak-ke-banyak antara dimensi atau antara tabel fakta dan dimensi dalam gudang data dan …


3
Indeks toko kolom berkerumun dan kunci asing
Saya kinerja menyetel gudang data menggunakan indeks. Saya cukup baru untuk SQL Server 2014.Microsoft menjelaskan hal berikut: "Kami melihat indeks columnstore berkerumun sebagai standar untuk menyimpan tabel fakta pergudangan data besar, dan berharap itu akan digunakan dalam sebagian besar skenario penyimpanan data. Karena indeks columnstore berkerumun dapat diperbarui, beban kerja …

1
Strategi kueri menggunakan tabel temporal versi sistem SQL Server 2016 untuk Dimensi yang Berubah Secara Perlahan
Saat menggunakan tabel temporal versi sistem (baru di SQL Server 2016), apa yang dimaksud dengan authoring query dan implikasi kinerja ketika fitur ini digunakan untuk menangani Dimensi Perlahan-lahan Mengubah dalam gudang data relasional yang besar? Misalnya, anggap saya memiliki Customerdimensi 100.000 baris dengan Postal Codekolom dan Salestabel fakta multi-miliar baris …


3
Bandingkan dua database Postgres serupa untuk perbedaan
Saya sesekali mengunduh set data yang tersedia untuk umum dalam bentuk Postgres dBs. Kumpulan data ini diperbarui / dimodifikasi / diperluas dari waktu ke waktu oleh host repositori. Apakah ada perintah atau alat Postgres (idealnya FOSS) yang dapat menunjukkan perbedaan antara database OLD dan BARU Postgres? (Asumsi yang berfungsi adalah …



1
Haruskah saya menonaktifkan "statistik pembaruan otomatis" dalam skenario pergudangan data?
Saya memiliki gudang data 200 GB di SQL Server. Saya telah mengalami waktu eksekusi yang sangat lambat untuk beberapa permintaan; misalnya 12 jam untuk deletekueri sederhana dengan inner join. Setelah melakukan riset dengan rencana eksekusi, saya memperbarui statistik dari 2 tabel yang terlibat dalam kueri, menggunakan WITH FULLSCANopsi. Permintaan sekarang …

2
Menangani zona waktu di data mart / gudang
Kami mulai merancang blok bangunan data mart / gudang dan kami harus dapat mendukung semua zona waktu (klien kami berasal dari seluruh dunia). Dari membaca diskusi online (dan dalam buku), solusi umum tampaknya memiliki dimensi tanggal dan waktu yang terpisah serta cap waktu di tabel fakta. Namun, pertanyaan saya mengalami …

2
Apakah kompresi data SQL Server baik untuk database hanya baca?
Beberapa literatur tentang kompresi data SQL Server yang saya baca menyatakan bahwa biaya penulisan meningkat menjadi sekitar empat kali lipat dari yang biasanya diperlukan. Tampaknya juga menyiratkan bahwa ini adalah kelemahan utama untuk kompresi data, sangat menyiratkan bahwa untuk database arsip read-only, kinerja akan (dengan beberapa pengecualian) ditingkatkan dengan penggunaan …

2
PostgreSQL untuk transaksi volume tinggi dan untuk pergudangan Data
Saya cukup baru untuk PostgreSQL, saya belum pernah melakukan penyebaran besar menggunakannya sebelumnya. Tetapi, saya memiliki pengalaman yang baik dalam solusi perusahaan dan saya ingin mencoba dan menerapkan beberapa dari apa yang saya pelajari menggunakan PostgreSQL. Saya memiliki situs yang berukuran untuk menangani sejumlah besar data dan lalu lintas. Infrastruktur …

1
Batasi derajat paralelisme (DOP) yang tersedia untuk permintaan apa pun
Pada Oracle Exadata (11gR2), kami memiliki basis data yang relatif gemuk. cpu_count adalah 24 parallel_server_inances adalah 2 parallel_threads_per_cpu adalah 2 Kami mencatat, melalui pengamatan di Oracle Enterprise Manager (OEM), bahwa kinerja sangat buruk karena permintaan dieksekusi secara serial. Untuk mengatasi ini, semua tabel, pandangan terwujud dan indeks diubah untuk mengambil …

2
Desain Gudang Data untuk melaporkan terhadap data untuk banyak zona waktu
Kami mencoba untuk mengoptimalkan desain data warehouse yang akan mendukung pelaporan terhadap data untuk banyak zona waktu. Misalnya, kami mungkin memiliki laporan untuk aktivitas selama satu bulan (jutaan baris) yang perlu menunjukkan aktivitas yang dikelompokkan berdasarkan jam dalam sehari. Dan tentu saja jam itu harus menjadi jam "lokal" untuk zona …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.