DATA WAREHOUSE (VERİ AMBARI) NEDİR?
Veritabanının verilerin sistematik bir koleksiyonu olduğundan bundan birkaç yazı önce bahsetmiştim. Eğer okumadıysanız şuradan yazıya ulaşabilirsiniz. Peki veritabanı tek başına yeterli midir? Yoksa geçmişteki verilere de ihtiyacımız var mıdır? Bir şirketin gelecekte başarılı olabilmesi için iyi kararlar vermesi gerekir. Bunun için tüm verileri dikkate almalıdır. Tabi bu verilerin de tek bir alanda bulunması gerekir. Bu da tam olarak veri ambarı (data warehouse) kavramını ortaya çıkarır. “Madem eski verilere ihtiyacımız var o zaman neden bunları veritabanında depolamıyoruz?” diye düşünebilirsiniz, fakat veritabanı 100 MB ile GB arasında veri depolayabilirken, veri ambarı 100 GB ile TB arasında veri depolayabilir. Tabi bu aralarındaki çok basit bir fark, yapı olarak da birbirlerinden çok farklılar, ben sadece küçücük bir farkı belirtmek istedim.
Bir veri ambarı (data warehouse) tek veya birden çok kaynaktan gelen geçmiş verileri depolayan bir bilgi sistemidir. Farklı kaynaklardan gelen verileri analiz etmek, raporlamak ve entegre etmek için tasarlanmıştır. Veritabanı verileri kaydetmek için, veri ambarı ise verileri analiz etmek için oluşturulmuştur.
Buna ek olarak veritabanları normalize halde olmasına yani basitçe, tekrar eden veriler ayrı tablolara bölünmesine rağmen, veri ambarında veriler normalize halde bulunmaz. Bu da çok büyük veri kümelerinde basit bir şekilde karmaşık sorgular gerçekleştirmeyi sağlar. Ayrıca veritabanı gibi kısa zamanlı olmadığı, içerisinde eski verileri de barındırdığı için sonuçlar daha faydalıdır.
Özetle:
Veritabanları sadece anlık veriyi tutarken, veri ambarları farklı kaynaklardan aldıkları eski verileri de depolarlar. Yani veri ambarı ileriye dönük doğru tahminlerde bulunabilmek adına çok yararlıdır.
Bu içerik
kaynaklarından ve Bahçeşehir Üniversitesi SEN2104 dokümanlarından faydalanılarak oluşturulmuştur. Okuduğunuz için teşekkürler :)