¿Es un problema que el INE utilice BigData?. Esto sólo es el principio.
La respuesta corta: No. La respuesta larga, depende.

(1/2) El principio: el caso de uso del INE
Esta semana se ha montado un gran revuelo porque el INE ha comprado a las principales compañías de telecomunicaciones (Telcos) los datos de geolocalización de todos sus clientes, para realizar un análisis de la movilidad en España durante unos días concretos.
Por supuesto, esos datos cuándo pasan de las Telcos al INE están agregados y anonimizados y cumplen con el RGPD vigente.
Entonces, ¿dónde está el problema?
Pues lo que ha generado tantas dudas, tanto cuestionamiento, inquietud, etc, creo que no es tanto el hecho en sí, como ciertas cuestiones de fondo ¿o de forma?:
Primero: ha puesto sobre la mesa algo que ocurre desde hace mucho tiempo: las Telcos venden los datos que generan sus clientes a otras empresas. Nada nuevo bajo el sol, lo que ha cambiado es que ahora lo sabemos todos y no sólo “los que nos dedicamos a esto”, pero al menos este caso servirá para que los usuarios tomen conciencia de cómo se tratan sus datos.
Y el tema es que esos datos pertenecen, al menos en parte, a los usuarios que los generan, sin embargo, el beneficio de la venta repercute únicamente en las Telcos. ¿Los usuarios tienen que asumir esto sin más?, ¿no caben opciones?, ¿no deberían las Telcos repartir estos beneficios con sus clientes?.
Segundo: qué datos. Las Telcos no sólo tienen la geolocalización del móvil en cada momento, también tienen los datos del contrato (dirección, producto contratado, número de líneas), pero es que además tienen los datos de la navegación web en aquellos casos en los que la línea de teléfono viene aparejada con línea para Internet. La navegación… es decir, los intereses del usuario, sus preocupaciones o su ideología que al final quedan registrados en su comportamiento digital. Y los metadatos (pero esto es otro post).
Y aquí el problema es la falta de claridad. En ningún sitio se está explicando con certeza qué otros datos -de los que tienen las Telcos- se van a asociar a la geolocalización. Es decir, tener información de dónde a dónde se mueve la población está bien, pero tenerla además segmentada por intereses, ideología, ingresos… está aún mejor, cosa que es posible con los datos potencialmente disponibles.
- Por ejemplo: saber cómo se mueven las personas de ingresos altos un lunes por la mañana camino al trabajo (normalmente del norte al centro) vs cómo se mueven las personas de ingresos bajos (normalmente del sur al centro)
- O podríamos saber en qué barrios viven las personas a las que les gusta el Real Madrid respecto a los barrios dónde viven los Atléticos. (Por no poner otros ejemplos más inquietantes).
- ¿Viven los vegetarianos en algún barrio en concreto?
Digo más, si el INE no utilizara esos datos adicionales para cualificar los desplazamientos, posiblemente estaría haciendo mal su trabajo. Pero, ¡sean transparentes por favor! y explíquenlo, que son el INE…
Tercero: datos anonimizados… y “desanonimizables”. Sí, los datos se van a facilitar anonimizados, ninguna duda. Pero también habría que explicar que un patrón de movimiento que incluye dónde duerme un móvil, dónde trabaja un móvil y cómo va de un sitio a otro es difícilmente anonimizable.
Vamos a ver, en tu casa, ¿cuántos móviles duermen? y ¿cuántos duermen y además trabajan/ estudian en el mismo sitio?. Es decir, que quitando ejemplos como Irene Montero y Pablo Iglesias, o Ferreras y Pastor, los patrones de movilidad fácilmente identifican individuos únicos.

Más allá de eso. Los datos que hoy son anónimos, mañana pueden dejar de serlo fácilmente. En ese sentido, ¿tenemos plena certeza de que en el futuro querremos, gobierne quién gobierne, sean las circunstancias que sean, que se normalice que el Estado acceda fácilmente a información tan detallada como nuestros movimientos?.
Cuarto: En general, la falta de transparencia en todo esto. Nos hemos enterado por la prensa… Si el INE va a utilizar una metodología novedosa (novedosa para ellos, insisto que esto lleva ya años haciéndose) que puede inquietar a los ciudadanos, lo mínimo sería una nota metodológica en condiciones explicando cómo se extraen los datos, cómo se anonimizan, cómo se comparten con el INE… No sé, el equivalente a lo que harían con un inocente estudio con encuestas.
Quinto: al hilo de las encuestas. Las encuestas también son anónimas y luego se trabaja con los datos agregados, sin embargo, te dan la oportunidad de no participar en la encuesta y/o de no contestar a las preguntas específicas que quieras. De hecho, en el código ético de la investigación social y de mercados se indica que para cada pregunta se debe dar la opción de contestar No Sabe o No Contesta.
¿Por qué se le exige más a una encuesta que al resto de datos?, ¿cómo puedo evitar ser incluído dentro del estudio del INE?, ¿puedo negarme a que se considere un desplazamiento en concreto igual que puedo hacerlo con una pregunta de un cuestionario?.
Y aquí hay que diferenciar entre:
- Movistar: no da ninguna opción para rechazar la participación
- Orange: pide que envíes una carta
- Vodafone: lo hace perfectamente y permite que puedas oponerte fácilmente desde la app de usuario
En general, no se trata de un tema funcional: el INE no está haciendo una cosa ilegal y posiblemente, si utiliza bien los datos, estará haciendo algo beneficioso para los ciudadanos. Se trata de un tema más complejo: los ciudadanos han empezado a entender qué está pasando con sus datos, que los datos tienen valor, qué es eso del BigData y qué implicaciones cotidianas tiene, que nuestro anonimato ya no es lo que era… Y necesitan y merecen más transparencia al respecto, especialmente cuándo los utilizan las Instituciones.
Frente a esto, desde mydatamood no queremos que se deje de utilizar el BigData, queremos promover la digitalización y el uso de datos, pero:
- de forma transparente: informando con claridad de lo que se hace, cómo se hace, por qué se hace, qué consecuencias puede tener
- de forma justa: si las Telcos están ganando dinero con los datos de sus clientes, al menos que sean honestas y repartan ese beneficio.
En el siguiente artículo (2/2) hablaremos del trasfondo del uso del BigData por parte de las Instituciones: ¿queremos que el Estado acceda a nuestra información sin filtro?
Únete al #NewDataDeal y, si quieres, ejerce tu derecho de oposición a través de mydatamood.com (disponible en breve, antes de que el INE haga su estudio)

