Una elección predecible

El 10 de diciembre (una semana antes de la segunda vuelta) posteé en mi Facebook una proyección de los resultados finales: Piñera ganaba con un 53.7%, Guillier obtenía un 46.3%. Dado que la estructura de votación de la primera vuelta se veía muy similar a la elección del 2009 (en cuanto los porcentajes de votación de los bloques Derecha, Gobierno, Voto Ciudadano/Nuevo Referente y Otros), se me ocurrió pensar que la dinámica de la votación para la segunda vuelta podía ser similar a la de aquella vez. Aplicando una simple regla de 3 más supuestos muy sencillos, calculando comuna por comuna, y sin usar datos de ninguna encuesta, se podía llegar a ese resultado.

Este es el posteo original en Facebook (lo pueden ver sin estar suscritos).

Esta tabla muestra la predicción por cada región, indicando la diferencia entre el resultado oficial y lo proyectado usando ese modelo. En amarillo las regiones menos ajustadas (más de 2 puntos de diferencia), en verde las que tienen una diferencia de menos de un punto. En 9 casos la precisión es mejor que un punto, y sólo en tres casos excede los dos puntos.

Dato oficial, dato proyectado y diferencia — segunda vuelta 2017

Escucho muchas opiniones respecto lo difícil que es predecir a este (supuesto) nuevo electorado, cómo lograr entender estas votaciones, en qué estará pensando el votante del Frente Amplio, siendo que al parecer no ha cambiado demasiado: se puede predecir usando una regla de 3 y un par de supuestos. El resumen de este ejercicio es simple: el electorado no ha cambiado tanto como nos lo pintan. El único comportamiento distinto en esta elección, fue el gran aumento de votantes en la segunda vuelta respecto de la primera vuelta, algo inusual. El resto fue similar.

A continuación, les explico los supuestos que hice, los datos de base usados y el resultado final. Agrego un breve análisis para distritos y comunas emblemáticas en esta elección, pues la predicción tiene la misma certeza hasta el nivel de comuna. Y finalmente saco algunas conclusiones que uno puede inferir de este ejercicio. Todos los datos y cálculos utilizados están disponibles en este enlace.

Similitudes de esta elección con la del año 2009

Plantear que ambas elecciones son comparables puede parecer un disparate: en la anterior el voto era obligatorio y ahora es voluntario, y ese cambio introdujo un nuevo padrón electoral. Una elección hecha ocho años atrás puede parecer lejana, en particular por la aparición del Frente Amplio. Sin embargo, la estructura de la votación fue muy similar. Si se analiza la estructura de la votación uno puede concluir que fueron muy parecidas en primera vuelta, con una votación similar (en cuanto porcentajes) en los bloques Derecha, Gobierno, Nuevo Referente, Otros.

En la elección del 2009 (primera vuelta) participaron Piñera, Frei, MEO y Arrate. Esta fue su votación:

Votación primera vuelta — 2009

En la elección del 2017 tuvimos 8 candidatos, y por primera vez dos candidatos de gobierno. Si agrupamos los candidatos en Derecha, Gobierno, Alternativo (o Nuevo Referente) y Otros, tenemos este cuadro:

Votación primera vuelta — 2017

Comparemos ambas votaciones:

Comparación primera vuelta 2009 — primera vuelta 2017

Según un análisis de Francesco Penaglia en El Mostrador, las últimas elecciones muestran un patrón interesante: “Al comparar las tres últimas elecciones, es posible identificar que un gran número de personas (cercano al 20%) votó por los candidatos que planteaban una alternativa “ciudadana y diferente”, es decir, por la novedad de las elecciones. El 2009 fueron 1.405.124 votos para Marco Enríquez-Ominami; el 2013 fueron 1.389.557 personas que votaron por la sumatoria del mismo Enríquez-Ominami y Parisi; en estas elecciones, 1.336.622 votaron por Beatriz Sánchez.”

El argumento de base para mi análisis se funda en ese patrón que sugiere Penaglia: ese voto alternativo, ciudadano o nuevo referente, ha sido similar en las últimas elecciones, si bien han votado en segunda vuelta de forma distinta.

Sin pecar de ingenuo, viendo esos datos en la última tabla, que son muy similares en cuanto la distribución de los votos en los 4 bloques indicados, uno puede suponer que lo que está pasando es que las condiciones en esta elección son similares a las del 2009 (salvo por los votos nulos y blancos), sin que sea requerido entrar en el análisis fino de la molestia social, la irrupción del FA, la credibilidad de los políticos, la situación económica, AFP, CAE, delincuencia y otros tantos más que los analistas están considerando para tratar de entender la elección.

Como referencia, esta votación no se compara con la primera vuelta de 2013, donde Bachelet sacó un rotundo 46.7% en primera vuelta, contra un 25.03% de Matthei. O la de 2005, con dos candidatos de derecha sumando 48% en primera vuelta, Bachelet un 46%, y Otros (izquierda) con un 5%.

Los supuestos para proyectar la segunda vuelta

El gran supuesto en todo este análisis, es que ese votante alternativo vota similar si se dan las mismas condiciones, que en este caso uno puede pensar se dan, por el hecho de que la votación de primera vuelta fue similar a la del 2009, en cuanto los porcentajes para cada bloque y más o menos comparable en cuanto total de votantes, en particular votos válidos. Entonces veamos cómo podemos distribuir los 4 distintos votantes de esa primera vuelta del 2009 (tenemos ese dato) en los dos candidatos finales del 2010 (que también es un dato), y esto lo podemos hacer comuna por comuna. De esa forma tendremos el “predictor”: cómo se distribuyeron los votos de aquellos que no pasaron a segunda vuelta, entre los que sí lo lograron.

Yo llamo supuestos heroicos a todos aquellos que me suenan razonables pero que no puedo defender completamente — o, dicho de otra forma, que son perfectamente cuestionables -, pero que me permiten explicar el resultado. Es factible que haya otros conjuntos de supuestos y mejores, que también lleven al mismo resultado. Al menos estos funcionaron razonablemente. Mis supuestos heroicos son estos:

S. Heroico #1. Es razonable suponer que los votos de Gobierno y Derecha se traspasaron directamente desde la primera vuelta a la segunda vuelta. En esa elección, la cantidad de votos válidos fue similar entre ambas.

S. Heroico #2. Es razonable suponer que los votos de la Izquierda (Arrate) se traspasaron directamente al candidato de Gobierno (Frei). Era un voto de izquierda bastante duro.

S. Heroico #3. También podemos suponer que los votos de MEO se distribuyeron entre Piñera y Frei en cierta proporción, para completar la votación de ambos. En este caso completamos los votos de Piñera con votos de MEO, luego el resto lo asignamos a Frei (podría ser al revés). Esto genera un ligero descalce en la votación de Frei.

S. Heroico #4. Existía un pequeño descuadre en el total de los votos al usar esta distribución, lo que corregí sumando el diferencial de votos válidos entre primera y segunda vuelta a Frei, con lo que el calce final era de 0.998 en el total de votos de Frei (Gobierno). Por la forma de cálculo Piñera siempre estuvo cuadrado. ¿Por qué votos válidos? Porque era la cifra disponible que generaba el mejor calce, sin ser perfecto en cada comuna.

S. Heroico #5. Antes de hacer el traspaso de votos, ajustamos la votación de los que no pasaron a segunda vuelta, usando el deflactor de votos válidos emitidos (#votos válidos 1ra vuelta / #votos válidos 2da vuelta).

Apliqué esos supuestos usando los datos para cada una de las comunas, con lo que obtuve los predictores de votación para cada una para ese voto “Alternativo” o “Nuevo Referente”.

Ejemplo. Hagamos el ejercicio con una comuna interesante: Puente Alto. Gran votación de Beatriz Sánchez en esta primera vuelta, aún con alcalde de derecha. Es una comuna que se ve difícil de predecir.

Estos son los datos de la elección del 2009, para primera y segunda vuelta. Los colores indican la ruta de los votos usando los supuestos. Se aplica el ajuste de la votación de MEO y Arrate (se deflactan), se transfieren los votos de MEO a Piñera y Frei, los de Arrate a Frei, se suma la diferencia de votos válidos entre ambas votaciones.

Ejemplo de cálculo del predictor — Puente Alto

Lo que nos dice este cálculo para esta comuna, es que un 31.18% del voto “Alternativo/Nuevo Referente” tenderá a votar por el candidato de derecha, y un 68.82% lo hará por el candidato de gobierno. En cada comuna los factores varían notablemente.

Proyección de la segunda vuelta del 2017

Del análisis anterior sale un predictor de votación por comuna, para el voto “Alternativo/Nuevo Referente”, que para esta elección son los del Frente Amplio (Beatriz Sánchez). Agregaremos un par de supuestos, referidos al votante de MEO en esta elección y el ajuste de votos.

S. Heroico #5. El votante de MEO en esta elección se comporta similar al del voto Alternativo/Nuevo Referente. Esto ya lo demostró en la elección anterior. Dado ese supuesto, el predictor se puede aplicar a este votante. Sólo por simplicidad y dado los pocos votos que obtuvieron Artés y Navarro, también se les aplicó el predictor. O sea, el predictor se aplicó a todos los votos de los que no pasaron a segunda vuelta.

S. Heroico #6. Se calculó el factor de votantes de segunda vuelta, usando la proporción de la elección de 2010. Este supuesto no fue correcto, pues la cantidad de electores aumentó mucho más que en las otras votaciones. Creo que ese efecto no era fácil de predecir, pues es la primera vez que ocurre.

S. Heroico #7. Se sumaron los votos nulos y blancos a Guillier. ¿Por qué a Guillier? Dado que la proyección me daba como ganador a Piñera por un margen muy amplio, preferí usar un supuesto similar al que había usado la primera vez (al sumar la diferencia de votos válidos a Frei para ajustar el modelo). Si se elimina este ajuste se obtiene incluso un mejor predictor de la votación (está disponible en el repositorio).

Apliquemos este procedimiento al ejemplo de Puente Alto. Estos son los datos de cálculo.

Ejemplo de aplicación del predictor — Puente Alto.

Usando el predictor ya indicado, se toman los votos de Sánchez, MEO y otros, ajustados por la diferencia de votantes entre primera y segunda vuelta del 2009 (deflactor de votantes), y se distribuyen entre Derecha y Gobierno. Los nulos y blancos se traspasan a Guillier, también deflactados en segunda vuelta. Tal como ya indiqué este ajuste era innecesario, pero es el formato que usé inicialmente y preferí mantenerlo.

El resultado final en Puente Alto fue de 46.84% para Piñera y 53.16% para Guillier: bastante similar a lo que se podía predecir: 45.71% y 54.29% respectivamente.

Todo esto, aplicado comuna por comuna, da lo indicado al inicio: en el total Piñera obtenía un 53.7% y Guillier un 46.30%. Usando el segundo set de datos (sin sumar los votos nulos y blancos) el modelo predice un notable 54.55% y 45.45%, casi igual al resultado final: 54.57% y 45.43%.

Algunos casos emblemáticos

Distrito 10. En este disputado distrito la votación fue de 51.74% Piñera, 48.26% Guillier. El modelo predecía 51.44% Piñera, 48.56% Guillier. Diferencia de 0.3 puntos

Araucanía. La votación más alta para la derecha, con un 62.40%. La proyección de base era de 62.05%. Diferencia de 0.35 puntos.

Región de Magallanes. La región que más votó por Guillier, con un 56.32%. El modelo preveía un 56.73%. Diferencia de 0.4 puntos.

Lo Barnechea. Esta comuna tuvo una de las más altas participaciones. El resultado para Piñera fue de 86.40%, y el modelo de base predecía un 82.42%. En este caso probablemente primó la mayor cantidad de gente que fue a votar en segunda vuelta, lo que no logró ser reflejado en el modelo.

Cerro Navia. Una de las comunas con mayor abstención. Alejandro Guillier ganó con un 54.86% de los votos. El modelo predecía que ganaría con un 56.39%.

Dado que el modelo sólo hace aritmética simple, se podría haber analizado el total de la votación y el resultado hubiera sido similar. Lo interesante es comprobar que a nivel de comuna también funciona.

Todos estos datos están disponibles en este repositorio (es una planilla Excel).

Nota: los datos de la primera vuelta de 2017 corresponden a los preliminares del SERVEL (que ellos amablemente me enviaron cuando se los solicité), por lo que pueden variar ligeramente respecto los finales (unos cuantos miles de votos).

Conclusiones

Al ver que los bloques de votación de este año (Gobierno, Derecha, Nuevo Referente, Otros) eran muy similares en cuanto porcentajes a los de la primera vuelta del 2009, supuse que se trataba de una elección similar, en cuanto al comportamiento del electorado. Para poder comprobarlo construí un modelo de cálculo muy sencillo — usando datos del 2009 y con pocos supuestos — para predecir cómo votaría este elector en la segunda vuelta. Si el elector es similar — postulé -, entonces el resultado de aplicar ese modelo en esta elección efectivamente predecirá la votación. El modelo previó una diferencia de algo más de 7 puntos, lo que finalmente ocurrió (9 puntos). A nivel de comuna, distrito y región la predicción también funcionó.

Mi conclusión es que, si aplicando una simple regla de 3, más supuestos muy sencillos, se puede predecir razonablemente el comportamiento del elector “Alternativo/Nuevo Referente” en la segunda vuelta, a cualquier nivel de agregación (comuna, distrito, región), eso quiere decir que el electorado no ha cambiado tanto como se ha sugerido. El elector del 2009, puesto en una disyuntiva parecida, votó de la misma forma, tanto en primera como en segunda vuelta.

Es factible que haya alguna correlación curiosa que hace que este predictor funcione por algún otro motivo, y que esta conclusión sea errónea. Si alguien la encuentra por favor que me haga el comentario.

Creo que las encuestadoras se equivocaron al no entender que este votante es el mismo de siempre, o muy similar. Bombardeadas por el tema del Frente Amplio, la crisis de la política y un largo etcétera, mi opinión es que esas empresas se confundieron y trataron de imaginar un votante que NO existe. El artefacto que diseñaron para entenderlo era incorrecto. Si hubieran hecho el seguimiento de ese votante alternativo, que ya se había manifestado en más de una ocasión, se hubieran dado cuenta que ese 8% que le asignaban a Sánchez no tenía sentido, y que estaba más cercano al 20%. Tampoco entiendo por qué las empresas que se dedican a analizar datos (que viven de eso), no han encontrado todavía este patrón tan simple de resolver (es un modelo lineal del estilo ax+b), o incluso llegar a un modelo aún más ajustado, que a mí parece muy factible.

Queda por analizar — y esa es para mí la gran, enorme duda a resolver — qué similitudes efectivamente se dieron en esta elección para que el elector se haya comportante de la misma manera, en primera y segunda vuelta. Ese análisis tomará más tiempo, y con supuestos aún más heroicos que los que yo hice.

Para finalizar: espero que esta información les sea útil. Por mi parte fue sólo un ejercicio intelectual para verificar la hipótesis indicada, esto es que el elector es similar. Creo — dado este análisis — que existe cierta pereza en las élites y cuadros técnicos para buscar respuestas, y también creo que quien haga realmente el trabajo tendrá mejores herramientas para obtener más triunfos (cualquiera sea su partido o ideario).

Todos los datos están disponibles en el repositorio (formato Excel) para que los usen como les parezca. Cualquier opinión es bienvenida, tanto respecto el modelo, conclusiones y supuestos.

Andrés Ávila

Diciembre 2017