¿Es un problema que el INE utilice BigData?. Esto sólo es el principio.

Ángela Álvarez
Nov 5 · 5 min read

La respuesta corta: No. La respuesta larga, depende.

(1/2) El principio: el caso de uso del INE

Esta semana se ha montado un gran revuelo porque el INE ha comprado a las principales compañías de telecomunicaciones (Telcos) los datos de geolocalización de todos sus clientes, para realizar un análisis de la movilidad en España durante unos días concretos.

Por supuesto, esos datos cuándo pasan de las Telcos al INE están agregados y anonimizados y cumplen con el RGPD vigente.

Entonces, ¿dónde está el problema?

Pues lo que ha generado tantas dudas, tanto cuestionamiento, inquietud, etc, creo que no es tanto el hecho en sí, como ciertas cuestiones de fondo ¿o de forma?:

Primero: ha puesto sobre la mesa algo que ocurre desde hace mucho tiempo: las Telcos venden los datos que generan sus clientes a otras empresas. Nada nuevo bajo el sol, lo que ha cambiado es que ahora lo sabemos todos y no sólo “los que nos dedicamos a esto”, pero al menos este caso servirá para que los usuarios tomen conciencia de cómo se tratan sus datos.

Y el tema es que esos datos pertenecen, al menos en parte, a los usuarios que los generan, sin embargo, el beneficio de la venta repercute únicamente en las Telcos. ¿Los usuarios tienen que asumir esto sin más?, ¿no caben opciones?, ¿no deberían las Telcos repartir estos beneficios con sus clientes?.

Segundo: qué datos. Las Telcos no sólo tienen la geolocalización del móvil en cada momento, también tienen los datos del contrato (dirección, producto contratado, número de líneas), pero es que además tienen los datos de la navegación web en aquellos casos en los que la línea de teléfono viene aparejada con línea para Internet. La navegación… es decir, los intereses del usuario, sus preocupaciones o su ideología que al final quedan registrados en su comportamiento digital. Y los metadatos (pero esto es otro post).

Y aquí el problema es la falta de claridad. En ningún sitio se está explicando con certeza qué otros datos -de los que tienen las Telcos- se van a asociar a la geolocalización. Es decir, tener información de dónde a dónde se mueve la población está bien, pero tenerla además segmentada por intereses, ideología, ingresos… está aún mejor, cosa que es posible con los datos potencialmente disponibles.

Digo más, si el INE no utilizara esos datos adicionales para cualificar los desplazamientos, posiblemente estaría haciendo mal su trabajo. Pero, ¡sean transparentes por favor! y explíquenlo, que son el INE…

Tercero: datos anonimizados… y “desanonimizables”. Sí, los datos se van a facilitar anonimizados, ninguna duda. Pero también habría que explicar que un patrón de movimiento que incluye dónde duerme un móvil, dónde trabaja un móvil y cómo va de un sitio a otro es difícilmente anonimizable.

Vamos a ver, en tu casa, ¿cuántos móviles duermen? y ¿cuántos duermen y además trabajan/ estudian en el mismo sitio?. Es decir, que quitando ejemplos como Irene Montero y Pablo Iglesias, o Ferreras y Pastor, los patrones de movilidad fácilmente identifican individuos únicos.

Más allá de eso. Los datos que hoy son anónimos, mañana pueden dejar de serlo fácilmente. En ese sentido, ¿tenemos plena certeza de que en el futuro querremos, gobierne quién gobierne, sean las circunstancias que sean, que se normalice que el Estado acceda fácilmente a información tan detallada como nuestros movimientos?.

Cuarto: En general, la falta de transparencia en todo esto. Nos hemos enterado por la prensa… Si el INE va a utilizar una metodología novedosa (novedosa para ellos, insisto que esto lleva ya años haciéndose) que puede inquietar a los ciudadanos, lo mínimo sería una nota metodológica en condiciones explicando cómo se extraen los datos, cómo se anonimizan, cómo se comparten con el INE… No sé, el equivalente a lo que harían con un inocente estudio con encuestas.

Quinto: al hilo de las encuestas. Las encuestas también son anónimas y luego se trabaja con los datos agregados, sin embargo, te dan la oportunidad de no participar en la encuesta y/o de no contestar a las preguntas específicas que quieras. De hecho, en el código ético de la investigación social y de mercados se indica que para cada pregunta se debe dar la opción de contestar No Sabe o No Contesta.

¿Por qué se le exige más a una encuesta que al resto de datos?, ¿cómo puedo evitar ser incluído dentro del estudio del INE?, ¿puedo negarme a que se considere un desplazamiento en concreto igual que puedo hacerlo con una pregunta de un cuestionario?.

Y aquí hay que diferenciar entre:

En general, no se trata de un tema funcional: el INE no está haciendo una cosa ilegal y posiblemente, si utiliza bien los datos, estará haciendo algo beneficioso para los ciudadanos. Se trata de un tema más complejo: los ciudadanos han empezado a entender qué está pasando con sus datos, que los datos tienen valor, qué es eso del BigData y qué implicaciones cotidianas tiene, que nuestro anonimato ya no es lo que era… Y necesitan y merecen más transparencia al respecto, especialmente cuándo los utilizan las Instituciones.

Frente a esto, desde mydatamood no queremos que se deje de utilizar el BigData, queremos promover la digitalización y el uso de datos, pero:

En el siguiente artículo (2/2) hablaremos del trasfondo del uso del BigData por parte de las Instituciones: ¿queremos que el Estado acceda a nuestra información sin filtro?

Únete al #NewDataDeal y, si quieres, ejerce tu derecho de oposición a través de mydatamood.com (disponible en breve, antes de que el INE haga su estudio)

el blog de mydatamood

la plataforma de intercambio de datos justo y transparente entre empresas y usuarios #NewDataDeal

Ángela Álvarez

Written by

Lo mío es empatizar y tratar de entender las cosas, ya sea analizando datos, contextos, ideas… Believer in mydatamood.

el blog de mydatamood

la plataforma de intercambio de datos justo y transparente entre empresas y usuarios #NewDataDeal

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade