Big Data, predicciones y libertad

Imagen de EL PAÍS

Hasta tiempos recientes, una de las grandes fuentes de negocio global, incluso antes de que se hablase de globalización, era el conjunto de lo que llamamos materias primas.

Pero, eso era cuando todos creíamos aún en la materia y en la energía. Actualmente, hay algo más que indicios de que cuanto existe, las distintas formas de la materia y la energía, no va a ser tratado como lo que hasta ahora creíamos que era, sino como información.

Así las cosas, el Big Data se postula como una nueva suerte de materia prima que sustituirá a todas las materias primas, de tal modo que los datos, que al hacerse masivos, han adelantado por la derecha a la fusión atómica, pretenden constituirse en la madre de todas las fuentes de negocio en el mundo actual y futuro.

La tecnología es lo que ha hecho posible, al permitir almacenar, ordenar y procesar ingentes cantidades de datos, que hayamos llegado a este punto. Para que la tecnología se haya desarrollado, ha sido necesaria una gran acumulación de datos, o, para entendernos, de cosas que al ser digitalizadas se han convertido en datos, tal como sucede con textos, sonidos e imágenes.

La experiencia indica que se ve lo que se mira, siendo ésta una gran limitación para el análisis, y cuando se observa el Big Data también se ve lo que se mira; y lo que se mira es, por encima de todo, lo que dice la industria de los datos masivos, a saber: todo es accesible a través de datos + los datos producen información + la información produce conocimiento + el conocimiento permite hacer predicciones + el conocimiento y las predicciones permiten decidir lo mejor para las organizaciones y para la sociedad. Como consecuencia, los datos serán lo más valioso que podremos procesar en adelante.

Empero, el punto fuerte de articulación en esta secuencia está en la predicción. Y, al mismo tiempo, en realidad, es el punto más débil. Tomemos, por ejemplo, un espacio en el que hacemos predicciones desde hace unos 100 años: el del comportamiento electoral en democracias representativas.

Sin ir más lejos, hace unos meses, ganó las elecciones en USA, contra la mayoría de los pronósticos, Donald Trump. Desde entonces, se ha señalado (y esto es bastante habitual), aquí y allá, una serie de mentes privilegiadas que, al parecer, predijeron con admirable antelación el resultado que finalmente se produjo. No se trata sólo de partidarios del ganador, que podrían estar afectados por un sesgo de identificación, sino también de adversarios, como George Lakoff. También, algunos, como los responsables de la empresa Cambridge Analytica, aseguraron haber contribuido de manera decisiva, prácticamente determinante, a la victoria del ganador.

Ahora bien, resulta que el ganador obtuvo menos votos populares que su rival, lo que, por lo pronto, muestra que la pugna fue muy ajustada. Además, hubo varios acontecimientos de última hora que pudieron ser a su vez decisivos: la última declaración del FBI sobre los e-mails de Hillary Clinton, los movimientos de Obama con Cuba, y, quizás, la presencia insidiosa de la inteligencia (ahora digital) rusa. La pregunta es: partiendo de que los que dicen haber anticipado el resultado estaban seguros del mismo (lo que se deduce de su énfasis en la anticipación y en el desprecio a todas las demás predicciones, que eran mayoritarias), ¿cómo es que ex-post se muestran tan seguros, cuando deberían tener en cuenta que sucedieron cosas que no podían predecir y que posiblemente tuvieron una gran influencia en que un resultado muy ajustado, en la frontera de máxima incertidumbre, se decantase hacia una de las dos opciones?

La respuesta lógica no puede ser que ellos sabían algo o que disponían de mecanismos de predicción especialmente finos y potentes; la respuesta lógica es que acertaron por pura casualidad. Que ex-post, en lugar de reflexionar sobre la incertidumbre de un proceso que lo que ha mostrado, sobre todo, es eso, incertidumbre, se afiancen en su capacidad predictiva, e, incluso, en su determinante capacidad para influir en que sus profecías se hayan cumplido, sólo viene a confirmar por enésima vez cuánto vivimos los humanos de tontas ilusiones.

Es sumamente interesante, al respecto, lo que sucedió con el Brexit, cuando se aseguró sin lugar a dudas que ganaría el remain, dado que las apuestas, de larguísima tradición en Inglaterra, lo daban por hecho. En ese marco, se acusó a las encuestas de fallar estrepitosamente, cuando estuvieron todo el tiempo moviéndose en estimaciones próximas al 50%, es decir, en la máxima incertidumbre.

Pero, lo interesante no es la pugna entre las apuestas y las encuestas (que, pese a cuanto se ha publicado, ganaron las encuestas, siempre que hablemos en términos aritméticos, por goleada), sino, una vez más, las voces que se supone que siempre estuvieron seguras de la victoria del Brexit. Veamos: las apuestas y las encuestas se decantaban al principio, ligeramente, hacia el remain, por tanto, se movían en ambos casos cerca de la máxima incertidumbre.

De manera que la información disponible no permitía, cabalmente, estar seguros de nada.

Lo que no sabían los del milagro predictivo es que las apuestas se iban a decantar pronto y de manera cada vez más acusada por el remain, pues de haberlo sabido podían haber razonado, cosa que es evidente que no hicieron, que, justamente esa posición de las apuestas es lo que a la postre iba a hacer ganar al Brexit… paradójicamente.

Claro, lo de los gurús que aciertan un resultado que parecía improbable, no es Big Data y no es científico, se dirá desde la cima de la montaña de datos. ¿Va a resolver esto de una vez el Big Data? Me atrevo a afirmar que no, al menos por una razón: siempre, por más sofisticación que despliegue, deberá trabajar con datos del pasado, por próximo que éste sea, y no podrá integrar los acontecimientos imprevistos entre el momento de la predicción y el momento de la votación.

En el mejor de los casos, el Big Data mejorará las predicciones, pero irá siempre por detrás de acontecimientos potencialmente determinantes del resultado (no sólo en el espacio electoral) y, posiblemente, deba enfrentarse con el tiempo a efectos poco controlables de las propias predicciones (si un modelo predice que los ocupantes de un barco se van a concentrar a babor y que eso va a escorar peligrosamente el barco, posiblemente se vea refutado por un desplazamiento mayoritario a estribor; si el proceso se repitiese muchas veces, posiblemente el pasaje terminaría distribuyéndose homogéneamente; en cualquier caso, la predicción se autorefutaría o estaría condenada a una interminable cadena de metapredicciones).

El Big Data se asocia a la amenaza de control del individuo por el Estado o por las grandes corporaciones, que, según esa asociación, invadirían nuestra intimidad y se apropiarían de los datos de lo que tenemos, lo que hacemos, lo que decimos… lo que somos. Pero, eso no sería nada si, además, se pudiese predecir lo que tendremos, lo que haremos, lo que diremos… lo que seremos, en el supuesto de que, precisamente con nuestros datos, se pudiese determinar completamente todo ello. Sin embargo, si el punto fuerte de articulación, que es la predicción, fallase, nuestra libertad no estaría tan amenazada, afortunadamente. Y fallará.

¿Servirá, entonces, para algo el Big Data? Sin duda, servirá para disponer de mejores representaciones de la realidad y, en la medida en que se aplique a espacios sobre los que sea posible corregir el tiro con rapidez y sin grandes costes (grandes áreas del consumo de productos, servicios y mensajes; desenlaces de procesos en espacios de aleatoriedad limitada, en general), servirá para tomar mejores decisiones, sobre todo mediante la implantación de dispositivos de machine learning, que, quizás, no habría que confundir con inteligencia artificial.

A las empresas cuyo negocio no son los servicios de datos, les conviene ser realistas (poco de “nice to know”), así empezarán antes a actuar, en vez de prolongar eternamente el panegírico estéril sobre los datos, emprenderán proyectos de desarrollo de sistemas de información con menores costes y con rápidos retornos, y aprenderán aceleradamente a incrementar el valor.

Juan Carlos Rodríguez Rojo