Actualización incremental en Power BI. Introducción

Mar Lizana
4 min readOct 3, 2023

--

¿Estás harto de las actualizaciones de datos que te hacen perder tiempo? ¿Te desespera estar mirando como se mueve esa ruedita? ¡Tenemos la solución perfecta!. ¿El ingrediente mágico? ¡El refresco incremental! ¿Listo para descubrir cómo puedes mantener tus datos frescos y tu tiempo libre de preocupaciones?

Empezamos una nueva serie de artículos:

Modo Import

Modo Import

Antes de empezar a definir que es el refresco incremental debemos entender como funciona el modo Import de Power BI. Es probable que si estás leyendo esto ya sepas de que va, y si no aquí van las ideas claves. Este modo se trae todos los datos al disco para que puedas realizar las consultas en memoria. Cada vez que se actualiza el modelo los datos se comprimen, optimizan y luego se almacenan gracias al motor de almacenamiento VertiPaq.

Sin embargo…¿qué más tenemos que tener en cuenta?

Si refrescamos nuestras tablas en modo import con la configuración que viene por defecto lo que sucederá por detrás es que se ejecutará un proceso donde se volverán a cargar todos los datos. TODOS. Esto se conoce como modo pull. Y puede ser tu peor enemigo si no tienes memoria suficiente o recursos de procesamiento.

Y aquí es donde aparece la maravillosa actualización incremental, pero…

¿Qué es la actualización incremental?

La actualización incremental es una práctica eficiente para agregar o modificar datos gradualmente en un conjunto de datos existente. Esta estrategia es común cuando los datos se generan o recopilan de forma continua a lo largo del tiempo, manteniendo actualizado el conjunto sin perder información histórica.

Y por eso es mucho más ligera en el proceso. ¿Te imaginas, solo actualizar aquellos datos nuevos en vez de todo cada vez que se lanza una actualización? Es una pasada.

En Power BI, la actualización incremental permite actualizar solo los datos que han cambiado o se han añadido desde la última actualización, en lugar de cargar todo el conjunto de datos cada vez. Esta función crea particiones, separando los datos que necesitan actualizarse con frecuencia de aquellos que lo hacen con menos frecuencia.

Lo destacado de la actualización incremental es que el servicio gestiona automáticamente este proceso según las directivas definidas por el usuario.

Lo mejor, a cada partición le podemos asignar un tipo de conexión diferente. Podemos definir que nuestra última partición se actualice de forma diaria o incluso en modo DirectQuery si no tenemos pasos que rompan el plegado de las consultas* y nuestro dataset en una capacidad Premium.

(*) El plegado de consultas es la capacidad que tiene PowerQuery de generar una única consulta con todos los pasos que tengamos. Aquí te dejo el enlace a la documentación. ¡RECUERDA! Con el botón derecho sobre tu último paso te aparecerá un menú, si tienes activa la opción Ver consulta nativa (View Native Query) es que la consulta se puede plegar.

View Native Query / Ver consulta nativa

Requisitos y consideraciones

Tipos de licencia compatibles

  • Compatible con Power BI Premium, Premium por usuario, Power BI Pro y Power BI Embedded.

Consideraciones sobre los orígenes de datos

  • El origen de datos deben admitir filtrado de fechas. Por lo tanto, deberá tener un campo fecha por el que filtrar
  • El plegado de consultas debe ser posible al incluir el filtro de fecha con los parámetros RangeStart y RangeEnd. No es necesario que la consulta final admita el plegado.
  • Todas las particiones deberán consultar a un único origen de datos

Para usar DirectQuery en la última partición

  • Compatible con licencias Power BI Premium, Premium por usuario y Power BI Embedded.
  • Si la directiva de actualización incremental incluye la última partición en DirectQuery, TODAS las transformaciones deberán admitir el plegado.

Límites en el tiempo de actualización

  • Conjuntos de datos Power BI Pro: límite de tiempo de actualización de 2 horas, independientemente de la actualización incremental. No admite la obtención de datos en tiempo real con DirectQuery.
  • Conjuntos de datos en capacidad Premium: Límite de tiempo de 5 horas.

Otras consideraciones

  • Al publicar un modelo en Power BI, la tabla con la política de refresco incremental tendrá una única partición. Estas se generaran n automáticamente en la primera actualización, cargando las filas según su fecha y hora.

Conclusiones

La actualización incremental en Power BI es la clave para mantener tus datos frescos sin perder tiempo en actualizaciones interminables. Automáticamente gestiona particiones, cargando solo lo que cambió desde la última vez.

Y para aquellos impacientes, ¡adiós a la ruedita que nunca termina! ¡Maravilloso, ¿verdad?!

Recuerda que la capacidad de utilizar la actualización incremental puede depender de la fuente de datos que estés utilizando y de las licencias de Power BI que tengas. Además, es importante mantener un seguimiento y una gestión adecuada de tus actualizaciones incrementales para garantizar la integridad de los datos y el rendimiento del informe.

Referencias

Actualización incremental y conjuntos de datos en tiempo real en Power BI — Power BI | Microsoft Learn

Actualización Incremental en Power BI — Incremental Refresh | SerDataPro

Toni Jurado y Diego Jurado Actualizaciones Incrementales fichero Excel Día 2 Miércoles Track 1 P — YouTube

Toni Ferrá Optimización de procesos en BI Empresarial Día 1 Martes Track 1 Power BI Espanol Vi — YouTube

Plegado de consultas — Power Query | Microsoft Learn

--

--

Mar Lizana

Data & Analytics Lead Engineer @NTT Data | Microsoft Data Platform MVP