Member-only story
Great Expectations: Calidad de Datos Open Source
Aplica validaciones automáticas a tus datos
🎁Si no eres miembro de Medium puedes leer gratis este artículo desde aquí…
Buen día red, cómo están?
En este artículo haré una introducción y primer contacto con Great Expectations, una herramienta para validar la calidad de nuestros datos que forma parte de llamado Modern Data Stack.
Great Expectations tiene dos presentaciones, en una trabajaremos con una UI web (Free Tier), en la otra con Python (Open Source). En este tutorial he puesto especial énfasis en que utilizar la opción Python sea sencilla de entender, por ello a continuación realizaremos dos pequeños desarrollos:
- Primero trabajaremos con la UI web, a fin de visualizar cada paso y familiarizarnos con los conceptos;
- y luego con Python para replicar lo antes aprendido y saber exactamente lo que estamos haciendo.
También les daré una recomendación para buscar qué tipo de validaciones se pueden aplicar a los datos, ya sea que se utilice Great Expectations u otra herramienta similar.
Veremos:
- Qué es Great Expectations?
- Clases de Expectations
- Calidad de datos: cómo empezar?
