Apa perbedaan antara database dan data warehouse?


163

Apa perbedaan antara database dan data warehouse?

Bukankah mereka hal yang sama, atau paling tidak ditulis dalam hal yang sama (mis. Oracle RDBMS)?

Jawaban:


147

Lihat ini untuk informasi lebih lanjut.

Dari tautan sebelumnya:

Basis data

  1. Digunakan untuk Pemrosesan Transaksional Online ( OLTP ) tetapi dapat digunakan untuk tujuan lain seperti Pergudangan Data. Ini merekam data dari pengguna untuk histori.
  2. Tabel dan gabungannya rumit karena dinormalisasi (untuk RDMS ). Ini dilakukan untuk mengurangi data yang berlebihan dan menghemat ruang penyimpanan.
  3. Entity - Teknik pemodelan relasional digunakan untuk desain database RDMS.
  4. Dioptimalkan untuk operasi penulisan.
  5. Kinerja rendah untuk kueri analisis.

Gudang data

  1. Digunakan untuk Pemrosesan Analitik Online ( OLAP ). Ini membaca data historis untuk Pengguna untuk keputusan bisnis.
  2. Tabel dan gabungannya sederhana karena dideormalisasi. Ini dilakukan untuk mengurangi waktu respons untuk pertanyaan analitis.
  3. Teknik Pemodelan Data - digunakan untuk desain Data Warehouse.
  4. Dioptimalkan untuk operasi baca.
  5. Kinerja tinggi untuk kueri analitik.
  6. Apakah biasanya Database.

Penting untuk dicatat juga bahwa Gudang Data dapat bersumber dari nol ke banyak basis data.


3
Pemodelan data adalah istilah umum dan tidak hanya berlaku untuk gudang data. (Mungkin dalam # 3 kedua mereka berarti "pemodelan dimensi" karena itu, dalam pengalaman saya, cara paling populer untuk membangun mereka.) Baris terakhir tidak masuk akal: bagaimana data warehouse "mengandung" database? Saya mungkin mengatakan data warehouse bersumber dari 0 hingga banyak (OLTP) database.
Patrick Marchand

2
@ Mark - Di mana katanya database HANYA untuk OLTP? Ini menunjukkan bagaimana database berhubungan dengan gudang data.
TheCloudlessSky

5
@Nickolay - Ini adalah jawaban dua tahun. Edit dan perbaiki jika Anda khawatir.
TheCloudlessSky

1
@ DataMan - Tandai ini sebagai jawaban yang benar. itu respon yang cukup bagus dan adil untuk pertanyaan Anda.
sanzy

1
apa perbedaan antara teknik Pemodelan Data dan Entitas - Teknik pemodelan relasional?
QAIS

32

Dari Tampilan Non-Teknis: Basis data dibatasi pada aplikasi atau set aplikasi tertentu.

Gudang data adalah repositori data tingkat perusahaan. Ini akan berisi data dari semua / banyak segmen bisnis. Ini akan membagikan informasi ini untuk memberikan gambaran global bisnis. Ini juga penting untuk integrasi antara berbagai segmen bisnis.

Dari tampilan Teknis: Kata "Data Warehouse" tidak diberi definisi yang dikenal. Secara pribadi, saya mendefinisikan gudang data sebagai kumpulan data-mart. Di mana masing-masing data-mart terdiri dari satu atau lebih basis data di mana basis data khusus untuk set masalah tertentu (aplikasi, kumpulan data atau proses).

Sederhananya database adalah komponen dari data-gudang. Ada banyak tempat untuk mengeksplorasi konsep ini, tetapi karena tidak ada "definisi", Anda akan menemukan tantangan dengan jawaban yang Anda berikan.


Datamart lebih disukai database OLTP?
CᴴᴀZ

@ CᴴᴀZ untuk apa? Datamart dibuat untuk OLAP, Datamart adalah basikal DWH kecil (untuk sebagian kecil bisnis). itu dibuat untuk Analisis jadi jika Anda membutuhkan Sistem OLTP Datamart bukan pilihan Anda, jika Anda memerlukan Data-Model untuk Analisis (Mulai Skema atau Aliran Salju) maka Anda akan lebih memilih Datamart.
Enrique Benito Casado

Hai @ Enrique, dapatkan poin Anda: Datamart berkontribusi ke OLAP. Saya mengambil isyarat Datamarts menjadi OLTP dari sini - SQL Server OLTP Datamart .
CᴴᴀZ

Hai @ CᴴᴀZ, saya membaca artikel dan itu hanya bagaimana membuat OLTP dengan Datamart. baik . (Tapi saya pikir mereka mengatakannya sebagai pengecualian). Ambil akun bahwa bagaimana mereka mengatakan lebih, Tabel OLTP mereka harus dinormalisasi agar tidak memiliki inkonsistensi. normalisasi tidak begitu rumit untuk dilakukan dalam skema ER tetapi jauh lebih rumit untuk Star-Schema atau Snow-Flow. Skema ini dibuat untuk memudahkan pembacaan dalam Database dan bukan operasi transaksional. Itulah mengapa menggunakan Datamart seperti OLTP seharusnya bukan ide yang baik meskipun mungkin.
Enrique Benito Casado

16

Gudang data adalah JENIS basis data.

Selain apa yang sudah dikatakan orang, gudang data cenderung menjadi OLAP, dengan indeks, dll. Disetel untuk membaca, tidak menulis, dan data tersebut dinormalisasi / diubah menjadi bentuk yang lebih mudah dibaca & dianalisis.

Beberapa orang mengatakan "database" sama dengan OLTP - ini tidak benar. OLTP, sekali lagi, adalah JENIS basis data.

Tipe lain dari "basis data": File teks, XML, Excel, CSV ..., File Flat :-)


1
Ini jawaban yang benar dari semuanya. Dan sedikit pada Datamart:It is a logical subset of Data warehouse, generally based upon business functions.
CᴴᴀZ

7

Cara paling sederhana untuk menjelaskannya adalah dengan mengatakan bahwa data warehouse terdiri dari lebih dari sekedar database. Basis data adalah kumpulan data yang diatur dalam beberapa cara, tetapi gudang data diatur secara khusus untuk "memfasilitasi pelaporan dan analisis". Namun ini bukan keseluruhan cerita karena pergudangan data juga mengandung "cara untuk mengambil dan menganalisis data, untuk mengekstrak, mengubah dan memuat data, dan untuk mengelola kamus data juga dianggap komponen penting dari sistem pergudangan data".

Gudang data


4

DataBase : - OLTP (proses transaksi online)

  • Ini adalah data saat ini, data terperinci terkini, data terisolasi relasional datar.
  • Hubungan entitas digunakan untuk merancang database
  • Ukuran transaksi DB 100MB-GB sederhana atau quires

Gudang data

  • OLAP (proses Analisis Online)
  • Ini adalah tentang data Historis Skema bintang, skema dan galaksi salju yang tertekuk
  • skema digunakan untuk mendesain data warehouse
  • Ukuran DB 100GB-TB Dasar kinerja permintaan yang ditingkatkan untuk DATA MINING DUAL VISUALISATION
  • Memungkinkan pengguna untuk memperoleh pemahaman dan pengetahuan yang lebih dalam tentang berbagai aspek data perusahaan mereka melalui akses interaktif yang cepat, konsisten, ke berbagai kemungkinan tampilan data

4

Gudang Data vs Basis Data: Gudang data dirancang khusus untuk analisis data, yang melibatkan pembacaan data dalam jumlah besar untuk memahami hubungan dan tren di seluruh data. Basis data digunakan untuk mengambil dan menyimpan data, seperti mencatat detail transaksi.

Gudang Data: Beban kerja yang sesuai - Analisis, pelaporan, data besar. Sumber data - Data dikumpulkan dan dinormalkan dari banyak sumber. Pengambilan data - Operasi penulisan massal biasanya berdasarkan jadwal batch yang telah ditentukan. Normalisasi data - Skema yang dinormalisasi , seperti skema Star atau skema Snowflake. Penyimpanan data - Dioptimalkan untuk kemudahan akses dan permintaan berkecepatan tinggi. kinerja menggunakan penyimpanan columnar. Akses data - Dioptimalkan untuk meminimalkan I / O dan memaksimalkan throughput data.

Database Transaksional: Beban kerja yang sesuai - Pemrosesan transaksi. Sumber data - Data yang diambil apa adanya dari satu sumber, seperti sistem transaksional. Pengambilan data - Dioptimalkan untuk operasi penulisan berkelanjutan karena data baru tersedia untuk memaksimalkan throughput transaksi. Normalisasi data - Skema statis yang sangat dinormalisasi. Penyimpanan data - Dioptimalkan untuk operasi menulis sepanjang tinggi ke blok fisik berorientasi baris tunggal. Akses data - Volume tinggi operasi baca kecil.


1

Setiap penyimpanan data untuk aplikasi umumnya menggunakan database. Itu bisa berupa basis data relasional atau tidak ada basis data sql yang saat ini sedang tren.

Data warehouse juga merupakan basis data. Kami dapat memanggil basis data gudang data sebagai penyimpanan data khusus untuk tujuan pelaporan analitis bagi perusahaan. Data ini digunakan untuk keputusan bisnis utama.

Data terorganisir membantu adalah melaporkan dan mengambil keputusan bisnis secara efektif.


1

Basis data:

Digunakan untuk Pemrosesan Transaksional Online (OLTP).

  • Berorientasi transaksi.
  • Berorientasi aplikasi.
  • Data sekarang.
  • Data terperinci.
  • Data yang skalabel.
  • Banyak Pengguna, Administrator / Operasional.
  • Waktu pelaksanaan: singkat.

Gudang data:

Digunakan untuk Pemrosesan Analitik Online (OLAP).

  • Analisis yang berorientasi.
  • Berorientasi pada subjek.
  • Data historis.
  • Data teragregasi.
  • Data statis.
  • Tidak banyak pengguna, manajer.
  • Waktu eksekusi: panjang.

1

Data Warehousing (DW) adalah proses untuk mengumpulkan dan mengelola data dari berbagai sumber untuk memberikan wawasan bisnis yang bermakna. Gudang data biasanya digunakan untuk menghubungkan dan menganalisis data bisnis dari sumber yang heterogen. Gudang data adalah inti dari sistem BI yang dibangun untuk analisis dan pelaporan data.


0

Sumber untuk gudang Data dapat berupa kumpulan Database, karena basis data digunakan untuk proses Transaksi Online seperti menyimpan catatan saat ini .. tetapi di gudang Data menyimpan data historis yang untuk proses analisis Online.


0

Gudang Data adalah jenis Struktur Data yang biasanya bertempat di Database. Gudang Data merujuk pada model data dan jenis data apa yang disimpan di sana - data yang dimodelkan (model data) ke server untuk tujuan analitis.

Database dapat diklasifikasikan sebagai struktur apa pun yang menampung data. Secara tradisional itu akan menjadi RDBMS seperti Oracle, SQL Server, atau MySQL. Namun, Basis Data juga dapat berupa Basis Data NoSQL seperti Apache Cassandra, atau MPP berbentuk kolom seperti AWS RedShift.

Anda melihat database hanyalah tempat untuk menyimpan data; gudang data adalah cara khusus untuk menyimpan data dan melayani tujuan tertentu, yaitu untuk melayani permintaan analitis.

OLTP vs OLAP tidak memberi tahu Anda perbedaan antara DW dan Database, baik OLTP dan OLAP berada pada basis data. Mereka hanya menyimpan data dengan cara yang berbeda (metodologi model data yang berbeda) dan melayani tujuan yang berbeda (OLTP - catatan transaksi, dioptimalkan untuk pembaruan; OLAP - menganalisis informasi, dioptimalkan untuk dibaca).


-1

Lihat dengan kata-kata sederhana: Dataware -> Penggunaan data besar untuk Analytical / storage / copy dan Analysis. Database -> Operasi CRUD dengan data yang sering digunakan.

Rumah Dataware adalah jenis penyimpanan yang tidak Anda gunakan setiap hari & Basis data adalah sesuatu yang sering Anda hadapi.

Misalnya. Jika kita meminta pernyataan bank maka itu memberi kita untuk 3/4/6 / lebih bulan terakhir karena itu dalam database. Jika Anda ingin lebih dari yang disimpan di rumah Dataware.


-1

Contoh: Sebuah rumah layak $100,000, dan itu dihargai pada$1000 per tahun.

Untuk melacak nilai rumah saat ini, Anda akan menggunakan database karena nilainya akan berubah setiap tahun.

Tiga tahun kemudian, Anda akan dapat melihat nilai rumah yang ada $103,000.

Untuk melacak nilai rumah historis, Anda akan menggunakan data warehouse sebagaimana nilai rumah seharusnya

$100,000 on year 0, 
$101,000 on year 1, 
$102,000 on year 2, 
$103,000 on year 3. 
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.