Condolasa Arroz
Published in

Condolasa Arroz

Claro como el agua

💧 Análisis de datos del Embalse de Río Tercero, Córdoba (AR)

Los anglosajones tienen una expresión que me encanta: long story short. Se usa cuando la intención del que narra es pasar por alto detalles innecesarios e ir directamente al grano. O sea, hacer corta una historia larga. Y no me gusta solo la expresión: me gusta la economía del lenguaje que propone la frase. Así que aquí va mi long story short.

Mi ciudad, Villa María, se inundó en marzo de 2014. Dos veces. Y volvió a inundarse en marzo de 2015. Nos dijeron que las inundaciones eran producto de lluvias extraordinarias en la cuenca alta del Río Tercero. Que por eso el Embalse Ministro Pistarini rebasaba y, qué macana, no quedaba más opción que erogar, río abajo, el agua que sobraba arriba. Así que, long story short, nos tocó comprar la idea de las lluvias extraordinarias que habían desbordado al Embalse.

Pero ahora hay un problema. Sin ninguna lluvia extraordinaria, el río y el Embalse vuelven a estar desbordados, y muchos vecinos se preguntan si estamos en la antesala de una (cuarta) potencial inundación.

Vires in datis

Los argumentos de excepcionalidad en la gestión de políticas públicas tienen un problema: suelen venir flojos de papeles. O no resisten archivo (o no tienen archivo), que para el caso es lo mismo. Y el debate en torno a la inundación de mi ciudad siempre me generó curiosidad por dos motivos:

  1. Porque nunca nos mostraron datos sobre precipitaciones en la cuenca alta del río para constatar si, efectivamente, había llovido por encima de la media habitual de los meses de verano.
  2. Porque jamás discutimos si el nivel del Embalse de Río Tercero creció excepcionalmente en 2014 y 2015 como consecuencia de esas supuestas lluvias extraordinarias.

Cuando detecto disonancias en una cadena de causalidad, me pongo a buscar datos y los analizo. Y eso hice. Al respecto, les tengo malas y buenas noticias.

Las malas, primero: no hay datos abiertos sobre las precipitaciones en la Provincia de Córdoba. Busqué por todos lados sin suerte y estuve a punto de pagar U$50 en OpenWeather para obtener series de tiempo de cinco ciudades testigo sobre ríos claves de la zona. Pero no llegué tan lejos, así que resigné esa parte del análisis.

La buena noticia es que conseguí datos oficiales del nivel del Embalse de Río Tercero desde 2010 hasta 2019, aunque con algunos inconvenientes. Hay muchísimas observaciones perdidas y los datos están en formatos que no siempre permiten su reutilización. Por eso tocó reconvertir los datasets y, para eso, conté con la ayuda de tres data entries de lujo: mi papá, mi mamá y mi hermana Loló. Ya con datos en mano, procedí al análisis en R.

El nivel del Embalse en perspectiva comparada

El primer gráfico es un diagrama de caja y bigotes, y lo más relevante del diagrama son las líneas negras horizontales adentro de cada caja. ¿Las ves? Esas líneas negras representan la mediana de cada conjunto de observaciones. Si te concentrás en marzo, vas a ver que la mediana durante la década 2010–2019 coincide con la cota de vertedero (46,50 m). Eso significa que el ≈50% de las observaciones registradas en marzo, a lo largo de una década, fueron superiores a la cota del vertedero.

Fig. 1. Elaboración personal en base a datos oficiales del Gobierno de la Provincia de Córdoba

Podrás decir, y con razón, que esta serie de tiempo está distorsionada por los valores de 2014 y 2015 (o sea, las supuestas lluvias extraordinarias). Por eso hice el mismo ejercicio con el cuatrienio 2010–2013 👇

Fig. 2. Elaboración personal en base a datos oficiales del Gobierno de la Provincia de Córdoba

¿Resultado? ¡La mediana de marzo es incluso superior a la cota del vertedero! Y, peor aún, los valores por debajo de los 46 metros son completamente atípicos —puntitos negros que se ven en la Fig. 2—.

Te lo paso en limpio: con o sin lluvias extraordinarias, lo ordinario de marzo es estar con el cu… ore en la mano. Con el cuore en la mano, digo, porque el Embalse rara vez tiene pulmón para amortiguar crecidas o precipitaciones (sean estas típicas o atípicas). Y si los gráficos de caja y bigotes resultaron confusos, aquí va un heatmap con los niveles promedio diarios desde 2010 hasta 2019.

Fig. 3. Elaboración personal en base a datos oficiales del Gobierno de la Provincia de Córdoba

Los niveles del Embalse por encima de la cota del vertedero, en marzo de 2014 y 2015, no fueron eventos atípicos. Desde mediados de febrero hasta mediados de mayo, de manera constante a lo largo de una década, el Embalse ha estado colapsado o a punto de estarlo. Inundarse era cuestión de tiempo. Y me gustaría seguir comprando la versión de la excepcionalidad de un cisne negro, pero resulta que le creo más a los datos que a los políticos.

Bonus track

Los datasets que construimos son una imperdible radiografía de las buropatías provinciales. El municipal que recoge los datos —a quien cariñosamente en mi familia bautizamos Agente Gómez—, no lo hace los sábados y domingos. Cuando se toma vacaciones, generalmente la primera quincena de enero, tampoco se registran datos.

Otros errores y omisiones son:

  • Los datos de abril de 2012 son idénticos a los de mayo del mismo año. En función de ello, decidí excluir el último.
  • En 2013, da la impresión de que el Agente Gómez se tomó vacaciones en diciembre porque falta el mes completo.
  • Los datos de febrero de 2019 son idénticos a los de marzo, y faltan los meses de julio y diciembre del mismo año.
  • El año 2020 registra solo dos observaciones: la del viernes 27 y la del lunes 30 de noviembre. ¿Agente Gómez con Covid-19? 🤔

--

--

--

Política & datos %>% filter(random == ¡muy random!)

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
María de los Ángeles Lasa

María de los Ángeles Lasa

Politóloga · Docente Universitaria · TEDxSpeaker · Cold War freak · marialasa.com

More from Medium

Using Data Science to understand how the Coronavirus is evading vaccines and immune systems.

Unrooted tree validating FUBAR results, plotted using iTOL (Image by Author)

What should you know before publishing your first AI research paper?

INFO: An Efficient Optimization Algorithm based on Weighted Mean of Vectors

Graph Theory for beginners