Otros tipos de Spam (II)

Senda en la Güeria Carrocera

En el post anterior os comentaba el calvario que supone para muchas personas el spam telefónico. En esta entrada os quiero contar algo sobre un método para enviar publicidad no deseada que me ha parecido muy sutil. Seguramente para muchos de vosotros quedará fuera de vuestro ámbito de uso de las nuevas tecnologías, pero a mí me ha resultado muy gracioso y sorprendente.

Se trata del spam en Google Analytics.

Las estadísticas web

Cuando se tiene una web es muy interesante saber quién visita tu página. Cuando una persona desde su móvil o PC abre un navegador web y llega hasta nuestra web, nos entrega mucha información. Os lo contaba en la entrada titulada “Nuestra huella digital”:

Aparte de la dirección a Internet, que es lo más obvio y directo que estamos exponiendo cuando estamos en Internet, de nuestro equipo se puede conocer, por el mero hecho de entrar en cualquier página web, el sistema operativo de nuestro PC/Tablet/Móvil, el navegador (Chrome, Firefox, …), los tipos de letra que tenemos instalados, la zona horaria, nuestro idioma preferido, los plugins que tiene instalado nuestro navegador, la resolución de pantalla, así como un identificador único que parece estar asociado a nuestro navegador.

Lo que hace Google Analytics es recopilar toda esta información y generar informes muy útiles que nos ayudarán a conocer el éxito de nuestra página y a mejorar. Nos muestra de forma gráfica información tan relevante como el país origen de las visitas, cuánto tiempo un visitante está en nuestra página, si han llegado a nosotros a través de búsquedas, etc.

¿Cómo pasamos la información recopilada por nuestro servidor web a Google Analytics?

Google ha ideado un método sencillo: basta con añadir un código javascript en nuestra página web mediante el cual, el navegador web de un visitante hará una llamada a los servidores de Google, de forma que recopilen la misma información que estamos registrando en el nuestro. Es decir, no le enviamos los datos recopilados sino que los registra directamente del navegador web de nuestro visitante.

Esa llamada a otra web es tan sumamente eficiente que es totalmente transparente para el usuario y el tiempo de carga de nuestra web no se ve penalizada. El tiempo de carga de una web es el tiempo que transcurre desde que el servidor web recibe la petición desde nuestro navegador hasta que termina de visualizarse. Depende de muchos factores: si la página se tiene que generar dinámicamente con cada petición (como es el caso de este blog) a través de algún lenguaje de programación (PHP, Perl, ASP, etc), si tiene imágenes pesadas, vídeos, o se debe ir a por contenidos que estén en otros servidores. No voy a entrar en los detalles de cada caso. Quedaos con la idea fundamental: si tenemos activado Google Analytics, cuando alguien vea nuestra web, también visitará los servidores Google Analytics donde quedarán registrados los datos que entregue su navegador web.

¿Cómo es el spam en Google Analytics?

Los navegadores web informan del lenguaje que tienen configurado y Google Analytics nos presenta una tabla tal que así:

Spam en Google Analytics

Spam en Google Analytics en la sección de idioma

Como podéis ver en la imagen, nos dice que el 40% de las sesiones de usuario que han visitado orviz.net han enviado el español como idioma de configuración de su navegador. Los otros textos que no son en-XX (identifica el inglés) son spam. ¿O acaso conocéis algún lenguaje que se llame “Congratulations to Trump and all americans”?

Los spammers consiguen insertar estos mensajes en nuestras estadísticas de la siguiente manera: para cada usuario registrado y cada web que quiera recopilar estadísticas, Google Analytics genera un código de usuario del tipo (UA-XXXXXXX-XX). Los spammers crean códigos al azar y lanzan sus invocaciones web con las cabeceras modificadas, de forma que Google cree que es una visita auténtica a nuestra web. Este gráfico ilustra el proceso:

Esquema de Spam en Google Analytics. Fuente: http://blog.analytics-toolkit.com/

Esquema de Spam en Google Analytics. Fuente: http://blog.analytics-toolkit.com/

Como podéis ver, las máquinas de los spammers 1 y 2, inyectan las peticiones directamente hacia los servidores de Google Analytics, sin interactuar en ningún momento con nuestro servidor web o con los usuarios. No han hackeado ningún servidor o usuario. No saben quién verá sus mensajes porque no conocen a quién corresponde cada código. Simplemente a base de prueba y error consiguen añadir estos mensajes para que los vean las personas que se dedican a analizar las estadísticas de sus sitios web.

Si estáis interesados en conocer cómo se soluciona el problema, podéis leerlo en este artículo, de http://blog.analytics-toolkit.com/ de donde he extraído la gráfica.

Animaros y comentad otro tipo de spam que os haya parecido curioso o realmente molesto.


Originally published at orviz.net.