Una Base de Series de Tiempo

Publicamos la “Base de Series de Tiempo de la Administración Pública Nacional”. Te contamos qué son las series de tiempo, cómo es la base y por qué es importante que la sumes a tu arsenal de datos abiertos.

Agustín Benassi
Datos Argentina

--

Por qué una base de series de tiempo

Qué son las series de tiempo

Las series de tiempo son todos aquellos datos ordenados cronológicamente que miden el valor de una variable a lo largo del tiempo. Responden preguntas como:

  • ¿Cuánto creció el PBI argentino entre el tercer trimestre de 2011 y el tercer trimestre de 2015?
  • ¿Cuál fue la inflación de los últimos 12 meses en bebidas e infusiones?
  • ¿Cuál es el nivel actual del tipo de cambio real multilateral, tomando a diciembre de 2001 como base?

Diversos actores de la academia, el gobierno, el sector privado y la sociedad civil usan a diario estas estadísticas y desperdician un 90% de su tiempo en el proceso de búsqueda, recolección, validación, normalización y compilación de aquellas que necesitan usar para su trabajo.

Si trabajás con estos datos, conocés lo tedioso de realizar estas mismas tareas una y otra vez… ni hablar cuando hay que actualizar el trabajo con los últimos datos.

Lo peor de todo: cientos de personas estamos haciendo estas mismas tareas de preparación sobre los mismos datos, duplicando esfuerzos en toda la comunidad.

Usualmente es sólo el 10% restante lo que nos queda para trabajar en las tareas de mayor valor agregado como:

  • Análisis de coyuntura socioeconómica.
  • Evaluación de impacto de políticas públicas.
  • Análisis de correlación entre variables.
  • Análisis de evolución histórica.
  • Investigación académica.

Estructurar los datos de una manera sistemática y automatizada, siguiendo un modelo de datos unificado, es una tarea crucial para comenzar a revertir esa ecuación.

Hoy presentamos una nueva forma de abrir estadísticas públicas bajo esa premisa.

Este proyecto comenzó con una sociedad ideal: el Ministerio de Hacienda está decidido a abrir al público cada vez más y mejores datos, y el Ministerio de Modernización está abocado a la tarea de desarrollar estándares y soluciones tecnológicas para hacer esto posible, alcanzando a una demanda de datos cada vez más amplia y diferenciada en sus necesidades.

Cómo es la base

En el portal nacional datos.gob.ar Las series de tiempo están disponibles en distintos formatos abiertos.

La base hoy contiene datos desde 1935, es de actualización diaria y permite la descarga de datos y metadatos por separado, o combinados en la misma tabla.

En la tabla de metadatos, se agregan algunos indicadores sobre las características de las series disponibles.

Se puede descargar en 4 formatos: CSV, XLSX, DTA y SQLITE.

Las primeras series de la base fueron publicadas por la Subsecretaría de Programación Macroeconómica como compilador de múltiples fuentes primarias. La base crecerá progresivamente, sumando nuevos organismos que publican series de tiempo dentro de la Administración Pública Nacional.

Fuentes primarias y frecuencias

Base de Series de Tiempo Actualizadas al 28 de septiembre de 2017.

Los casos de referencia en el mundo

Existen ejemplos destacados en la publicación de series de tiempo en el mundo que son nuestro modelo en la hoja de ruta de este proyecto.

Tal como nos cuenta Keith Taylor, la iniciativa pionera de la Reserva Federal de Estados Unidos (FRED) publica series de tiempo desde hace más de 50 años. En aquellos tiempos esto era un servicio que brindaban por… ¡correo postal!

Hoy ofrecen un explorador web de series de tiempo, a la vez que mantienen servicios web abiertos y gratuitos para integrar en aplicaciones y flujos de trabajo automatizados de terceros.

Pioneros La Reserva Federal de Estados Unidos publica series de tiempo desde hace más de 50 años.

La Organización para la Cooperación y el Desarrollo Económicos (OECD) mantiene a su vez un explorador web de series de tiempo y su API, bajo el estándar SDMX que busca facilitar el intercambio de datos estadísticos en todo el mundo.

El Banco Mundial publica varias bases de series de tiempo actualizadas, como los Indicadores de Desarrollo Mundial y mantiene varias APIs para su consulta programática.

Hoja de ruta

Estamos convencidos de que la publicación de esta base de series diariamente actualizada es un paso importante para comenzar a revertir la ecuación de esfuerzo en el trabajo con datos.

Pero esto sólo es un primer paso.

Nuevamente, imaginemos que queremos responder la pregunta:

  • ¿Cuánto creció el PBI argentino entre el tercer trimestre de 2011 y el tercer trimestre de 2015?

Sólo necesitamos los valores de 16 trimestres de la serie “PIB a precios de comprador, en millones de pesos de 2004 y valores trimestrales”. No queremos descargar la serie completa para eso... ¡mucho menos la base completa con más de 8000 series!

Lo que queremos es seleccionar un recorte en el tiempo de la serie.

Ahora imaginemos intentar responder:

  • ¿Cómo evolucionó la recaudación impositiva entre el cuarto trimestre de 2015 y el cuarto trimestre de 2016, como porcentaje del Producto Bruto Interno?

Podríamos descargar dos series (recaudación y PBI) a una planilla de cálculo para dividir una por la otra y obtener el resultado. Esto sería un esfuerzo duplicado una y otra vez, que resta tiempo del verdadero objetivo.

Lo que en realidad queremos es consultar la operación entre las series.

La API / servicio web de series de tiempo

El paso posterior a la publicación de la base de series de tiempo, será publicar un servicio web que permita hacer todas estas consultas de manera programática, obteniendo exactamente el recorte de datos que se necesite:

  • Operando entre series (proporción de una serie sobre otra, deflación de una serie nominal por un índice, etc)
  • Transformando series (variación porcentual, escala logarítmica, índice de base 100 en un determinado período, etc)
  • Cambiando la frecuencia de las series (transformando una serie mensual en una serie trimestral, semestral o anual)

El explorador web de series de tiempo

Una API permite desde integrar una consulta actualizable en Excel hasta desarrollar todo tipo de aplicaciones y reportes automáticos. Sin embargo, no es fácil de usar por la mayor parte de los usuarios.

El próximo paso luego de publicar la API, será desarrollar una aplicación web para explorar series de tiempo, que ofrezca una experiencia intuitiva y sencilla donde poder responder todas esas preguntas visualizando o descargando los datos.

¿Usás series de tiempo en la facultad o en tu trabajo diario? Nos encantaría que nos cuentes por Twitter o por mail para qué y de qué manera las usás, si esta base que publicamos te facilita tu trabajo y cómo podría facilitártelo aún más.

--

--

Agustín Benassi
Datos Argentina

Economista, programador y activista de la apertura de datos. Director de Datos Públicos en la Secretaría de Modernización de la Nación Argentina.