Aumentos del subte y usuarios racionales

Federico Pousa
Sep 11, 2018 · 9 min read

Siempre me interesó la información relacionada con el transporte y en particular me interesan los problemas de optimización sobre el transporte público. Cuando descubrí las plataformas de datos abiertos como http://estadisticas.produccion.gob.ar/, encontré muchos datos relacionados al transporte que me podían ayudar a responder preguntas que siempre tuve. Muchas veces escuché personas haciendo comparaciones sobre diferentes medios de transporte “mejor me tomo el bondi, a esta hora va super directo”, “tomate el subte, vas a llegar mucho más rápido”, “¿viste lo que aumentó el subte? mejor voy en colectivo”. De todas esas frases, se puede ver que existen personas que cuando tienen alternativas para ir a un lugar no les da lo mismo, sino que analizan qué prefieren de uno u otro medio de transporte para hacer la elección. En particular me interesó la última observación, la cual la escuché varias veces y por eso me generó esta duda. Si una persona tiene la chance de elegir entre dos o más medios de transporte público, ¿Cuánto influye el precio de los mismos? ¿Puede el precio del transporte hacer que una persona elija utilizar un medio “peor” (por ejemplo, más lento)?

Image for post
Image for post
¿Subte o Colectivo?

La respuesta es muy simple, hay gente a la que sí le influye y hay gente a la que no. Hay gente que depende del transporte para llegar a su trabajo a diario y el gasto le representa un esfuerzo importante, así como existen personas que toman un colectivo y no saben cuánto sale un viaje. Sin embargo, lo que estaría bueno saber, es que pasa a nivel general. ¿Es considerable la cantidad de usuarios racionales sobre el total?

Con el siguiente análisis no pretendo dar una respuesta cerrada a este tema. El flujo de usuarios en una red de transporte es un tema por demás complejo y son muchísimos los factores que influyen, pero tal vez se pueda echar un poco de luz sobre la cuestión.

En particular poniendo el foco de la pregunta en la Ciudad de Autónoma de Buenos Aires, lo que me interesó ver es si los aumentos de precio en el subte impactan en la cantidad de gente que lo usa. En general, en CABA, el subte es un medio de transporte más rápido que el colectivo. Por lo cual sería interesante ver si una buena porción de usuarios están dispuestos a utilizar un medio de transporte más lento para contrarrestar un aumento en la tarifa de subtes.

Para eso, empecemos por ver un poco como son los “números del subte”. En primer lugar, veamos como es el flujo de usuarios. Si bien los datos obtenidos en http://estadisticas.produccion.gob.ar/ tienen información desde el año 1993, voy a utilizar la información de los últimos 10 años (2008 al 2017) por una cuestión de visualización y porque son los años donde mayor impacto hubo en la tarifa del subte.

Image for post
Image for post

Este gráfico sólo muestra datos crudos y, sin embargo, ya muestra información que puede resultar de interés para entender el funcionamiento del subte.

En primer lugar, visualizar la información de una manera adecuada nos puede ayudar a detectar algún tipo de problema. En este caso, si miramos el gráfico, podemos ir viendo diferentes patrones que se cumplen, cosas que se parecen entre sí, otras que no se parecen tanto y algunas cosas raras. Por ejemplo, muchas personas al ver este gráfico ven que pasó algo raro al comenzar el 2013 con la línea A. La línea A pasa de tener un comportamiento controlado y parecido al de la línea C, a tener 0 usuarios. Es simple encontrar la razón para este hecho puntual, y es que la línea A estuvo cerrada por reparaciones durante ese período (https://www.lanacion.com.ar/1543084-viene-de-tapacierran-desde-el-12-la-linea-a-de-subtes). En este caso lo interesante no es la explicación en sí, sino el hecho de que visualizar los datos de un proceso ayudan a encontrar un problema que de otra manera podría haber sido más difícil.

Otra cosa que podemos ver del gráfico es que la línea parecen tener un comportamiento parecido, excepto por la H. Parecido no en la cantidad de usuarios, sino en cómo crece o decrece su utilización en cada uno de los meses. Para ver qué tan parecidas son realmente podemos ver la correlación entre dos líneas. La correlación entre dos conjuntos de datos es una medida de qué tan predecible es un conjunto de datos con respecto al otro. Si la correlación es positiva entonces cuando los datos de un conjunto crecen, en el otro también. Si la correlación es negativa entonces cuando los datos de un conjunto crecen, en el otro decrecen. Si la correlación es cercana a 0, eso significa que los comportamientos de los conjuntos de datos parecen ser más independientes. Lo importante para ver si dos conjuntos de datos correlacionan bien, es ver la magnitud de esta medida sin importar el signo. La correlación es una medida que puede tomar valores entre -1 y 1. En general, si el valor absoluto es mayor a 0.5 se habla de una correlación fuerte.

Para ver entonces cómo es la correlación entre las líneas de subte podemos utilizar lo que se conoce como matriz de correlación, que no es más que una tablita que condensa todas las correlaciones entre cada par de líneas de subte.

Image for post
Image for post

Esta matriz de correlación nos confirma lo que se percibía visualmente en el primer gráfico. La línea H no correlaciona bien con el resto. Esto tiene mucho sentido, la línea H es la más nueva de todas las líneas y en los últimos 10 años es la que mayor crecimiento porcentual de vías tuvo, por lo cual es lógico que su cantidad de usuarios no esté estabilizada sino que esté en continuo crecimiento a medida que crece la extensión de la línea. Sacando la H, todas las demás líneas correlacionan fuertemente entre sí, confirmando que la variación de usuarios en las diferentes líneas tienen comportamientos muy parecidos. Esto, en cierta manera, significa que si obtenemos conclusiones sobre el funcionamiento de una línea, podríamos de alguna manera traducir esa conclusión al resto.

Un último punto a remarcar sobre el primer gráfico, es que cada una de las líneas parece tener un comportamiento anual bien marcado. Nuevamente es una conclusión no demasiado sesuda, en Enero y Febrero hay mucha gente que se toma sus vacaciones, junto con los estudiantes. En Marzo vuelven todos a la vez. Después hay otros eventos como semana santa, vacaciones de invierno, etc. Sin embargo, es un comportamiento a chequear por dos motivos. Primero porque nuevamente es interesante poder ver como los datos certifican una noción intuitiva o una sensación que tenemos sobre un cierto proceso. Por otro lado, chequear un comportamiento anual de los usuarios nos ayuda a después hacer comparaciones más razonables. Si los meses tienen un comportamiento particular y se repite anualmente, no tiene sentido ver por ejemplo el crecimiento de la cantidad de usuarios mes a mes, sino que tiene sentido ver esto por cada mes, en función del mismo mes del año anterior.

Para ver esto podemos utilizar nuevamente la medida de correlación. En este caso lo que hago es tomar los usuarios de la línea D, y ver cómo correlacionan los años entre sí.

Image for post
Image for post

De esta matriz podemos ver dos cosas. Por un lado, dado que todos los valores son altos, se confirma que los usuarios tienen un comportamiento cíclico anual, por lo cual tendrá sentido analizar cómo varían los usuarios en cada mes del año. Por otro lado, si bien todos los valores son altos, los valores correspondientes al año 2012 son notoriamente diferentes, indicando que algún comportamiento distinto sucedió ese año.

Con esto nos vamos acercando a la pregunta original sobre los precios. No parece ser casualidad que el quiebre en el funcionamiento del subte se da en el año 2012. Año en el que el subte sufrió su mayor aumento porcentual. En enero de 2012, un viaje en subte pasó de valer 1.1 a valer 2.5, totalizando un 127% de aumento. Si volvemos sobre el gráfico original, solo a ojo se ve que en el año 2012 todos las lineas tienen un fuerte decaimiento en sus usuarios, y que luego tardan varios años en volver a tener la cantidad de usuarios que tenían previo al 2012.

Para ver más en detalle cómo afectaron los aumentos del subte, voy a graficar los usuarios de la línea D, marcando cuando fueron los aumentos. Para esto no voy a graficar los usuarios de manera total, sino que lo que voy a mostrar es el crecimiento porcentual mes a mes, tomando como referencia los meses del 2008. Es decir, en el gráfico vamos a ver porcentualmente cuánto creció o decreció la cantidad de usuarios en Enero de 2009 con respecto de Enero del 2008, Enero de 2010 con respecto a Enero del 2008, 2011 con respecto a 2008 y así para cada año y para cada mes del año.

Image for post
Image for post

Como podemos ver en el gráfico, las etiquetas rojas nos marcan los aumentos del subte y se ve que tuvieron un impacto notorio en la cantidad de usuarios. A partir del aumento más fuerte del 2012, y con ayuda de los aumentos de 2013 y 2014, la cantidad de usuarios decreció con respecto al año 2008 y se mantuvo consistentemente por debajo del 2008 por un buen período. Recién por el 2016 pudo retomar los niveles del 2008. Esto parece indicar que la respuesta a la pregunta original es que sí, que realmente hay una cantidad interesante de usuarios racionales que migran de un transporte a otro según la tarifa. Sin embargo, este gráfico me deja otras preguntas. ¿Por qué el primer y el último aumento no parecen impactar mucho? ¿Donde va la gente que se va del subte?

Bueno, dónde va la gente es una pregunta muy compleja y, como dije al principio, no pretendo en esta cantidad de palabras buscar una explicación final al flujo de usuarios de una red de transporte. Mi poco conocimiento de CABA me hace pensar que la alternativa natural al subte D son los colectivos que van por Avenida Cabildo y por Avenida Santa Fe. Sin embargo podría haber otros lugares donde la gente migre: Tren Mitre, Autos, Caminatas, Bicis. También podrían suceder otro tipo de hechos en vez de migraciones como que se reduzca la capacidad de carga del subte porque se reducen la cantidad de servicios o que directamente se reduzca la demanda de usuarios por algún factor externo como podría ser el aumento del desempleo.

Teniendo en mente estas dos últimas preguntas y la intuición de que el competidor natural del subte D son los colectivos, el siguiente gráfico muestra nuevamente la información de usuarios del subte D, pero ahora marco también los períodos en que es más barato uno u otro servicio.

Image for post
Image for post

Este último gráfico ya parece bastante más concluyente. Los períodos de crecimiento y decrecimiento de usuarios en el subte muestra una clara relación con los períodos en donde el subte es más barato o más caro que el colectivo dado los aumentos que van sufriendo ambos servicios. El período prolongado en donde el colectivo es más barato que el subte engloba a casi todas las muestras negativas (es decir cuando hubo un decrecimiento de los pasajeros con respecto al año 2008).

Esto no significa que el precio sea la única explicación para ver por qué migran los usuarios. De hecho el crecimiento de los años 2016 y 2017 del subte bien podrían ser influenciados por otros factores. Durante el 2016 la Avenida Cabildo era un caos por las obras del metrobus (https://www.clarin.com/ciudades/metrobus-norte-gba-plaza-italia_0_Bk9HFPXGl.html) por lo que eso también podría incentivar a migrar hacia el subte. Desde noviembre de 2016 existe el boleto estudiantil gratuito en el subte (http://www.telam.com.ar/notas/201609/164047-boleto-estudiantil-gratuito-ciudad-rodriguez-larreta.html), lo cual seguramente se ve fuertemente reflejado en Marzo del 2017.

De todas maneras, aunque puedan haber muchos otros factores para explicar un proceso tan complejo, parece bastante evidente la relación entre la tarifa y la cantidad de usuarios. De hecho, esto dispara algunas preguntas finales: ¿Los aumentos son acompañados por algún estudio que indique el impacto en la cantidad de usuarios?. ¿Podemos proyectar la cantidad de usuarios en los próximos meses en función de los aumentos que se vienen?. Si podemos proyectar, ¿Tiene sentido aumentar un cierto porcentaje el subte si después eso se traduce en perder una buena parte de los usuarios?

Los datos están, seguramente un buen análisis nos puede a ayudar a responder estas y otras preguntas.

Eryx

Developing ideas

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch

Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore

Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store