Data Warehouse vs Big Data Analytics
Perkembangan teknologi semakin mempermudah pimpinan perusahaan untuk mengambil kebijakan strategis. Beberapa teknologi baru yang mempermudah penentuan kebijakan adalah data warehouse dan big data analysis.
Data warehouse adalah suatu konsep teknologi yang memberikan fasilitas kepada perusahaan untuk memelihara data historis baik itu yang berasal dari sistem maupun aplikasi operasional. Data warehouse berbentuk pusat repositori informasi yang berisi seluruh aset informasi berupa database terstruktur milik perusahaan. Data-data yang terdapat pada data warehouse bersifat subject oriented, berdimensi waktu, serta non-volatile. Data warehouse biasanya digunakan pada DSS (Decision Support System) dan EIS (Executive Information System). Data yang terdapat pada data warehouse tersusun secara spesifik untuk dapat dianalisis menggunakan query.
Sedangkan big data analytics adalah proses mengumpulkan, mengorganisasikan dan menganalisis sekumpulan besar data (big data) untuk mendapatkan pola-pola dan informasi yang dapat mendukung pengambilan kebijakan strategis perusahaan. Beberapa cara menganalisis data pada big data analytics antara lain clustering, partisi, dan digudangkan pada data warehouse. Dalam pemrosesan big data, ada 3 dimensi pendukung yang dikenal dengan istilah 3V yaitu :
- Variety : kompleksitas data yang dianalisis, mengacu kepada jenis-jenis format dan apakah data-data tersebut terstruktur atau tidak.
- Velocity : kecepatan pengumpulan data untuk diolah.
- Volume : ukuran data yang dianalisis.
Perbedaan utama dari data warehouse dan big data analytics adalah data warehouse menggunakan data milik perusahaan yang tersimpan secara rapi dan terstruktur secara query, sedangkan big data analytics teroptimasi untuk dapat mengolah data tak terstruktur.
Satu perbedaan lagi adalah ukuran data. Big data analytics (Hadoop related) memang didesain untuk mengolah data berukuran besar dengan mendistribusikan data-data tersebut ke banyak server. Ketika server-server tersebut penuh, cukup menambahkan server baru (node) untuk menambah kapasitasnya. Sedangkan pada data warehouse, ketika server melebihi kapasitasnya, diharuskan membeli lagi server yang ukurannya lebih besar.
Pada penentuan kebijakan strategis perusahaan sekarang ini, data warehouse masih dapat dikatakan relevan namun tidak cukup jika hanya menganalisis data internal perusahaan yang terdapat data warehouse saja. Big data analytics juga diperlukan karena cakupan datanya lebih luas.
