INTRODUCCIÓN DATA WAREHOUSE EN BIGQUERY

Datapath
Datapath

--

Queremos acelerar el talento en data y analytics en LATAM. Si te gusta el artículo recuerda que todos los meses tenemos inicios de nuestros programas especializados de Data Engineering, Data Analyst, Cloud y Machine Learning Engineer. Puedes conocer más aquí.

Definición de un Data Warehouse
Es el lugar en el que se almacena toda la información que se obtiene de las diferentes fuentes de la empresa. Asimismo, un Data Warehouse es el lugar en el que se concentran todos los datos con un diseño especial de centralización para explotar la información para diferentes propósitos, por ejemplo, la generación de reportes, el análisis de data, tableros de control, minería de datos, etc.

Imagen 1: recuperada del sitio web; https://gurussolutions.com/solutions/data-toolkit/bi-netsuite/data-warehouse

Características Data Warehouse
La principal idea de implementar un Data Warehouse es que debe haber un solo registro de cliente a pesar de que este cliente esté en varios sistemas de la base de datos. Por ello, debe contar con una información integrada; es decir, todos los aplicativos e información externa estén centralizadas y disponible para que los usuarios puedan tomar decisiones con datos de calidad.

El modelo de datos debe estar orientado al contextos de información del negocio. En otras palabras, debe haber solo una identidad de cliente, producto, puntos de venta, locales, etc.

Imagen 2: Creación propia

Los registros se actualizan menos en comparación con los sistemas transaccionales, ya que en los sistemas OLTP se realiza constantemente sentencias como insert, update y dalete sobre pequeñas cantidades de registros de datos; en cambio, en un Data Warehouse, se realizan operaciones a grandes, miles y millones de volúmenes de datos. En otras palabras, es muy poco común usar aquellas sentencias sobre registros puntuales. Almacena historia sobre lo cambios o nuevas versiones de los registros en el tiempo, que depende del movimiento y evolución que realiza un cliente en los registros.

Uso de BigQuery como Data Warehouse
BigQuery es un Data Warehouse multi cloud de alta escalabilidad, rentable y sin servidor. Del mismo modo, facilita procesar grandes volúmenes de datos a un menor precio. Las principales características son las siguientes:

Imagen 3: Recuperada del sitio web; https://k21academy.com/google-cloud/google-bigquery-cloud-data-warehouse/

ELASTICIDAD DE PROYECTOS

  • Se puede crecer en función a la demanda del negocio.
  • Es fácil dimensionar toda la infraestructura como la integración, explotación de datos y otros servicios que se pueden incorporar conforme se avanza.

EFICIENCIA DE COSTOS

  • Los costos son menores por los recursos en la nube, ya que no se cubre el tema de gestión, mantenimiento y administración como en una solución Sofware Local.
  • Los pagos son mensuales en función al consumo y uso de los recursos.
  • Se puede monitorear lo que vas consumiendo desde el uso de cuotas que dependen de cada área de la organización.

USABILIDAD DE LOS DATOS

  • Se puede trabajar con los recursos de forma rápida y cuando se requiere; es decir, no se invierte tiempo en instalación. Facilidad para compartir datos a los usuarios finales de manera más ágil y centralizada.
  • Permite proteger los datos internos de la organización para solo compartir información específica.

PROCESAMIENTO DE LOS DATOS

  • Procesa billones de registros en petabytes en pocos segundos. Soporte de procesamiento en streaming. Soporte de funciones analíticas que facilitan y optimizan el uso de los recursos.
  • Analiza los datos en grandes volúmenes de información. Soporta modelos de aprendizaje automático como BigQuery ML.
Imagen 5: Tomada del sitio web; https://dataedo.com/blog/3-google-bigquery-tools-everyone-should-know

Giomar Antaurco Trejo
Coordinador Académico Datapath

Conoce nuestros programas

✔Descubre cómo acelerar tu talento en Data, Analytics y Cloud:

  • Tenemos inicios todo los meses, conoce más aquí.

En nuestro viaje por el mundo de los datos, las redes sociales son el epicentro de nuestras actividades. ¡Síganos en nuestras redes sociales para acceder a contenido exclusivo, noticias relevantes y ser los primeros en conocer nuestros próximos programas y eventos! ¡Descubran el universo de datos que tenemos preparado para ustedes! ¡No se pierdan ni un dato!

instagram.com/datapathformation/

tiktok.com/@datapath

youtube.com/@datapathformation

facebook.com/datapathformation

Originally published at https://dev.to on June 19, 2023.

--

--