Jawaban:
Lihat ini untuk informasi lebih lanjut.
Dari tautan sebelumnya:
Basis data
Gudang data
Penting untuk dicatat juga bahwa Gudang Data dapat bersumber dari nol ke banyak basis data.
Dari Tampilan Non-Teknis: Basis data dibatasi pada aplikasi atau set aplikasi tertentu.
Gudang data adalah repositori data tingkat perusahaan. Ini akan berisi data dari semua / banyak segmen bisnis. Ini akan membagikan informasi ini untuk memberikan gambaran global bisnis. Ini juga penting untuk integrasi antara berbagai segmen bisnis.
Dari tampilan Teknis: Kata "Data Warehouse" tidak diberi definisi yang dikenal. Secara pribadi, saya mendefinisikan gudang data sebagai kumpulan data-mart. Di mana masing-masing data-mart terdiri dari satu atau lebih basis data di mana basis data khusus untuk set masalah tertentu (aplikasi, kumpulan data atau proses).
Sederhananya database adalah komponen dari data-gudang. Ada banyak tempat untuk mengeksplorasi konsep ini, tetapi karena tidak ada "definisi", Anda akan menemukan tantangan dengan jawaban yang Anda berikan.
Gudang data adalah JENIS basis data.
Selain apa yang sudah dikatakan orang, gudang data cenderung menjadi OLAP, dengan indeks, dll. Disetel untuk membaca, tidak menulis, dan data tersebut dinormalisasi / diubah menjadi bentuk yang lebih mudah dibaca & dianalisis.
Beberapa orang mengatakan "database" sama dengan OLTP - ini tidak benar. OLTP, sekali lagi, adalah JENIS basis data.
Tipe lain dari "basis data": File teks, XML, Excel, CSV ..., File Flat :-)
It is a logical subset of Data warehouse, generally based upon business functions.
Cara paling sederhana untuk menjelaskannya adalah dengan mengatakan bahwa data warehouse terdiri dari lebih dari sekedar database. Basis data adalah kumpulan data yang diatur dalam beberapa cara, tetapi gudang data diatur secara khusus untuk "memfasilitasi pelaporan dan analisis". Namun ini bukan keseluruhan cerita karena pergudangan data juga mengandung "cara untuk mengambil dan menganalisis data, untuk mengekstrak, mengubah dan memuat data, dan untuk mengelola kamus data juga dianggap komponen penting dari sistem pergudangan data".
DataBase : - OLTP (proses transaksi online)
Gudang data
Gudang Data vs Basis Data: Gudang data dirancang khusus untuk analisis data, yang melibatkan pembacaan data dalam jumlah besar untuk memahami hubungan dan tren di seluruh data. Basis data digunakan untuk mengambil dan menyimpan data, seperti mencatat detail transaksi.
Gudang Data: Beban kerja yang sesuai - Analisis, pelaporan, data besar. Sumber data - Data dikumpulkan dan dinormalkan dari banyak sumber. Pengambilan data - Operasi penulisan massal biasanya berdasarkan jadwal batch yang telah ditentukan. Normalisasi data - Skema yang dinormalisasi , seperti skema Star atau skema Snowflake. Penyimpanan data - Dioptimalkan untuk kemudahan akses dan permintaan berkecepatan tinggi. kinerja menggunakan penyimpanan columnar. Akses data - Dioptimalkan untuk meminimalkan I / O dan memaksimalkan throughput data.
Database Transaksional: Beban kerja yang sesuai - Pemrosesan transaksi. Sumber data - Data yang diambil apa adanya dari satu sumber, seperti sistem transaksional. Pengambilan data - Dioptimalkan untuk operasi penulisan berkelanjutan karena data baru tersedia untuk memaksimalkan throughput transaksi. Normalisasi data - Skema statis yang sangat dinormalisasi. Penyimpanan data - Dioptimalkan untuk operasi menulis sepanjang tinggi ke blok fisik berorientasi baris tunggal. Akses data - Volume tinggi operasi baca kecil.
Setiap penyimpanan data untuk aplikasi umumnya menggunakan database. Itu bisa berupa basis data relasional atau tidak ada basis data sql yang saat ini sedang tren.
Data warehouse juga merupakan basis data. Kami dapat memanggil basis data gudang data sebagai penyimpanan data khusus untuk tujuan pelaporan analitis bagi perusahaan. Data ini digunakan untuk keputusan bisnis utama.
Data terorganisir membantu adalah melaporkan dan mengambil keputusan bisnis secara efektif.
Basis data:
Digunakan untuk Pemrosesan Transaksional Online (OLTP).
Gudang data:
Digunakan untuk Pemrosesan Analitik Online (OLAP).
Data Warehousing (DW) adalah proses untuk mengumpulkan dan mengelola data dari berbagai sumber untuk memberikan wawasan bisnis yang bermakna. Gudang data biasanya digunakan untuk menghubungkan dan menganalisis data bisnis dari sumber yang heterogen. Gudang data adalah inti dari sistem BI yang dibangun untuk analisis dan pelaporan data.
Sumber untuk gudang Data dapat berupa kumpulan Database, karena basis data digunakan untuk proses Transaksi Online seperti menyimpan catatan saat ini .. tetapi di gudang Data menyimpan data historis yang untuk proses analisis Online.
Gudang Data adalah jenis Struktur Data yang biasanya bertempat di Database. Gudang Data merujuk pada model data dan jenis data apa yang disimpan di sana - data yang dimodelkan (model data) ke server untuk tujuan analitis.
Database dapat diklasifikasikan sebagai struktur apa pun yang menampung data. Secara tradisional itu akan menjadi RDBMS seperti Oracle, SQL Server, atau MySQL. Namun, Basis Data juga dapat berupa Basis Data NoSQL seperti Apache Cassandra, atau MPP berbentuk kolom seperti AWS RedShift.
Anda melihat database hanyalah tempat untuk menyimpan data; gudang data adalah cara khusus untuk menyimpan data dan melayani tujuan tertentu, yaitu untuk melayani permintaan analitis.
OLTP vs OLAP tidak memberi tahu Anda perbedaan antara DW dan Database, baik OLTP dan OLAP berada pada basis data. Mereka hanya menyimpan data dengan cara yang berbeda (metodologi model data yang berbeda) dan melayani tujuan yang berbeda (OLTP - catatan transaksi, dioptimalkan untuk pembaruan; OLAP - menganalisis informasi, dioptimalkan untuk dibaca).
Lihat dengan kata-kata sederhana: Dataware -> Penggunaan data besar untuk Analytical / storage / copy dan Analysis. Database -> Operasi CRUD dengan data yang sering digunakan.
Rumah Dataware adalah jenis penyimpanan yang tidak Anda gunakan setiap hari & Basis data adalah sesuatu yang sering Anda hadapi.
Misalnya. Jika kita meminta pernyataan bank maka itu memberi kita untuk 3/4/6 / lebih bulan terakhir karena itu dalam database. Jika Anda ingin lebih dari yang disimpan di rumah Dataware.
Contoh: Sebuah rumah layak $100,000
, dan itu dihargai pada$1000
per tahun.
Untuk melacak nilai rumah saat ini, Anda akan menggunakan database karena nilainya akan berubah setiap tahun.
Tiga tahun kemudian, Anda akan dapat melihat nilai rumah yang ada $103,000.
Untuk melacak nilai rumah historis, Anda akan menggunakan data warehouse sebagaimana nilai rumah seharusnya
$100,000 on year 0,
$101,000 on year 1,
$102,000 on year 2,
$103,000 on year 3.