Saya pemula mencoba membungkus kepala saya di sekitar OLAP, dan saya punya beberapa pertanyaan.
- Pertanyaan 1: Dapatkah kubus OLAP menyimpan median, mode, persentil?
- Pertanyaan 2: Dapatkah kueri MDX yang ditulis pengguna mengembalikan ringkasan data tingkat baris? (mis:% transaksi> $ 100). Atau haruskah desainer kubus menambahkan ini ke kubus?
- Pertanyaan 3: Apakah produk OLAP sekarang menyediakan mekanisme untuk mengakses data tingkat baris? Yang?
Departemen TI kami sedang mencari umpan balik tentang masalah apa yang kami alami dengan kubus MSAP Layanan Analsis ROLAP tertentu. Kami tidak memiliki akses ke basis data relasional di belakangnya dan perlu melakukan perhitungan yang saat ini tidak tersedia sebagai ukuran dalam kubus.
Biarkan saya melihat apakah saya memiliki hak ini.
- Sebuah kubus dapat memberikan statistik untuk jumlah, sarana, proporsi, standar deviasi.
- Jika statistik tertentu belum dipenuhi dalam ukuran yang disediakan oleh perancang kubus, dapatkah kami menulis kueri MDX untuk mendapatkannya? Atau apakah mereka perlu mengubah kubus untuk pra-menghitungnya dari data tingkat baris?
- Sebuah kubus tidak dapat memberikan statistik seperti median, mode, atau persentil, karena statistik ini tidak bertambah baik.
Saya membaca The Grammar of Graphics karya Leland Wilkinson dan dalam babnya tentang Penambangan Data dan OLAP, katanya
[Operasi kubus] ini berfungsi baik dengan statistik seperti jumlah, rata-rata, proporsi, dan standar deviasi. Agregasi sederhana di atas subclass dapat dihitung dengan beroperasi pada jumlah, jumlah kuadrat, dan istilah lain yang digabungkan dalam fungsi linear untuk menghasilkan statistik ringkasan dasar.
Mereka tidak bekerja dengan baik dengan statistik seperti median, mode dan persentil karena agregat statistik ini bukan statistik agregat mereka. Median median bukan median agregat, misalnya.
Dia kemudian menambahkan:
Model ROLAP yang lebih canggih telah muncul baru-baru ini. Dimungkinkan, melalui beberapa teknologi, untuk memberikan akses algoritma statistik ke data mentah melalui model relasional secara real time. Pendekatan ini lebih menjanjikan daripada agregasi kaku yang ditawarkan oleh struktur seperti kubus data.
Dalam bentuk paling elegan dari arsitektur ini, aplikasi dapat meminta koneksi jarak jauh untuk memberikan informasi tentang metode penanganan data mereka dan mengambil tindakan yang sesuai tergantung pada informasi yang dikembalikan. Dalam bentuk ini, arsitektur komponen dapat mencapai janji nyata dari komputasi terdistribusi: desain dan eksekusi yang tidak tergantung pada situs, sistem operasi, atau bahasa.
Itu ditulis sekitar tahun 2005. Apakah ada yang mengetahui produk menggunakan metodologi ini untuk memungkinkan akses data tingkat baris?