Jadi apa bedanya Datawarehouse dengan Database pada umumnya?

Adam Mukharil Bachtiar
Universitas Komputer Indonesia
3 min readJan 3, 2020

Salah satu bahasan yang tidak ada habisnya di semesta data adalah Datawarehouse. Datawarehouse dipercaya bisa membantu pihak manajerial maupun executive untuk mengambil keputusan strategis. Pertanyaan yang sering muncul adalah

“Memang apa bedanya datawarehouse dengan database operasional biasa?

Saya tidak akan membahas tentang apa itu datawarehouse karena sudah banyak literatur yang menjelaskan hal ini akan tetapi mari kita mulai perbincangan ini dengan membahas dua skema data berikut:

Skema Data 1
Skema Data 1
Skema Data 2
Skema Data 2

Mana yang merupakan skema datawarehouse dan mana yang database biasa? Secara model konseptual yang ditampilkan pada Skema Data 1 dan Skema Data 2, dua skema ini memiliki tampilan yang sangat mirip sehingga kalau kita hanya melihat “bentuk badan” dari dua skema ini akan sulit menentukan mana yang datawarehouse dan mana yang bukan. Kita harus melihat dua skema ini dengan “Mind’s eye”.

Di sini perbedaannya

Database operasional berbicara di level keperluan informasi sehari-hari. Misal pada kasus supermarket maka kebutuhan informasi yang seringkali muncul adalah ada berapa transaksi hari ini, stok barang apa saja yang harus segera dibeli dan sudah habis, atau berapa total uang masuk hari ini. Untuk memunculkan informasi tersebut, Skema data 2 bisa menyajikan hal-hal tersebut dengan mudah. Kita hanya perlu melakukan query sederhana yang memanfaatkan fungsi agregat (count, sum, max, min, etc) dan voila… Informasi yang dibutuhkan akan muncul.

Ilustrasi potongan Query pada Skema Data 2
Ilustrasi potongan Query untuk memunculkan kebutuhan informasi dari Skema Data 2

Sementara itu, datawarehouse biasanya digunakan untuk memunculkan kebutuhan fakta yang terjadi berdasarkan sudut pandang bisnis tertentu (seperti misalnya: berdasarkan pelanggan, daerah transaksi, toko, dan lain-lain) dan periode waktunya panjang (tahunan). Sebetulnya Skema Data 2 bisa saja memunculkan kebutuhan informasi tersebut akan tetapi Skema Data 1 lebih dioptimasi untuk memunculkan kebutuhan informasi tersebut.

Gambaran perbedaan Skema Data 1 dan 2
Gambaran perbedaan Skema Data 1 dan 2

Bayangkan jika kita membutuhkan fakta total penjualan per barang per bulan dalam 3 tahun tertentu maka Skema Data 1 hanya perlu “sekedar di-select (walaupun pada implementasinya ada query OLAP yang harus dipahami)” karena pada dasarnya angka summary total penjualan sudah disimpan dalam skema tersebut. Lain hal dengan Skema Data 2 yang membutuhkan “keringat” cukup banyak untuk memunculkan kebutuhan informasi tersebut karena butuh mengkomputasi terlebih dahulu baru kemudian dimunculkan.

Jadi kesimpulannya?

Skema data yang merupakan skema datawarehouse adalah Skema Data 1. Ciri khasnya (jangan cuma lihat ada penamaan tabel dimensi dan fakta) adalah tabel di sekeliling tabel fakta hanya menyimpan atribut yang penting saja (stok tidak ada karena bukan masalah di level strategis) dan juga yang disimpan di dalam skemanya adalah summary dari fakta-fakta yang terjadi di level operasional. Kita tidak bisa bertanya siapa saja yang beli di hari ini atau bertanya stok yang akan habis atau sudah habis hari ini ke Skema Data 1 karena Skema Data 1 tidak menyimpan hal tersebut.

--

--

Adam Mukharil Bachtiar
Universitas Komputer Indonesia

Director of Technology and Information System, CEO of CodeLabs and Lecturer at Informatics Engineering UNIKOM