Un sistema para engancharlos a todos: el sistema de recompensa variable (II)

Hugo Sáez
9 min readJun 21, 2018

--

Esta es la segunda parte de una serie de artículos que hablan acerca del sistema de recompensa variable, el mecanismo mediante el cual las redes sociales, los videojuegos y las apuestas nos mantienen enganchados a ellas. En la primera parte (que puedes leer aquí) expliqué como el psicólogo B.F Skinner descubre que recompensando a animales de forma variable por una conducta, éstos repiten constantemente esa conducta durante mucho tiempo. El profesor Robert Sapolsky demostró con sus experimentos que la dopamina era la responsable de esta repetición: una sustancia que nos empuja a perseguir constantemente ciertas acciones al ver una señal y que nuestro organismo segrega en gran cantidad cuando la recompensa por realizar la acción es variable.

Hoy hablaremos de cómo los diseñadores digitales han estudiado el sistema de recompensa variable y lo han aplicado a sus productos, con el objetivo de que pasemos el mayor tiempo posible con ellos.

El mecanismo de la adicción

En el artículo anterior expliqué cómo la dopamina causa el comportamiento y el sistema de recompensa variable la utiliza para guiarlo. Este mecanismo tiene una explicación evolutiva: los seres vivos que más perseguían sus objetivos ante la incertidumbre tenían más posibilidades de sobrevivir, porque eran capaces de conseguir más alimento, más seguridad y reproducirse más veces que los que no lo hacían. Pero este mecanismo no está exento de peligro, ya que la dopamina puede conducir a un comportamiento adictivo.

Para explicar esto utilizaré las investigaciones de Kent Berridge, un profesor de neurociencia de la universidad de Michigan. Kent defiende que los seres vivos tenemos dos sistemas que se complementan, querer y gustar. El sistema “querer” es el que te motiva a la acción y está alimentado por la dopamina. El sistema “gustar” es el que te hace disfrutar de lo que obtienes y a la vez, te hace sentirte satisfecho cuando lo has conseguido para que pares de buscar. El sistema “querer” es más fuerte que el sistema “gustar” y la evolución es de nuevo la explicación: los seres vivos que seguían buscando comida después de haberse quedado satisfechos tenían más posibilidades de sobrevivir que los que se quedaban sentados disfrutando. Tú mismo habrás experimentado la fuerza del sistema “querer” al enfrentarte a un plato que te gusta mucho y seguir comiendo incluso después de saciarte.

Las complicaciones surgen cuando estos sistemas son trampeados de alguna manera, como sucede con las drogas y el sistema “querer”. Debido al uso continuado de éstas, este sistema se vuelve hiper-sensible a cualquier señal que lleve a consumir más y las mismas señales se vuelven hiper-salientes. Es como si el mono del experimento de Sapolsky del que hablaba en el artículo anterior comenzara a ver botones por todas partes y no pudiese dejar de pulsar todos los que se encuentra, ya que quiere volver a sentir esa descarga de dopamina. Este comportamiento persiste incluso años después de haber dejado de consumir, lo que explica porqué muchas personas caen de nuevo en las drogas tras mucho tiempo de abstinencia.

El sistema “gustar” también puede ser fácilmente trampeado, ya que simplemente necesita una recompensa que nunca le acabe de saciar del todo. Las consecuencias de trampear este sistema son más sutiles, pero no por ello menos adictivas.

Loops de dopamina

Nuestro cuerpo y nuestra mente funcionan compenetrados y de manera coordinada. Como acabamos de ver la dopamina es un recurso evolutivo que nos ha ayudado a perseguir mejoras constantes sin descanso y que además cuenta con un mecanismo que lo sacia para compensar. Nuestro estómago nos manda una señal cuando está lleno de comida y no necesita más, nuestras piernas nos avisan con dolor después de mucho ejercicio para que descansemos.

Pero este sistema se desarrolló durante millones de años para una época donde el único objetivo era mejorar nuestras condiciones, perpetuar nuestra especie e intentar sobrevivir a los peligros del entorno. Su funcionamiento no está pensado para el siglo XXI. Éste es el principal problema de la dopamina y de los sistemas de recompensa variable: pueden ser utilizados con otros fines que no son la mejora evolutiva. Y aquí entran las redes sociales, los videojuegos y las apuestas.

Así como nuestro cuerpo puede ser saciado rápidamente, nuestra mente tiene una capacidad mucho mayor. La dopamina no sólo nos impulsa a buscar comida, sino también información, socialización o diversión. Y si introduces un sistema de recompensa variable en cualquiera de estas búsquedas a nuestro cerebro le cuesta decir basta. Así entramos en un “loop de dopamina”: la dopamina te incita a la acción, obtienes la recompensa y como no te sacias, vuelves a realizar la acción. De ahí la sensación de adicción.

Existe todo un modelo de diseño de productos digitales basado en el sistema de recompensa variable, llamado “Modelo de comportamiento para el diseño persuasivo”. Esta corriente se inició con el profesor B.J. Fogg en la universidad de Stanford en Estados Unidos, aunque ahora se ha extendido por todo el mundo en gran medida gracias a sus alumnos, que trabajan en muchas de las grandes compañías digitales. Aunque BJ Fogg defiende el uso ético del modelo, muchas veces se ha utilizado con objetivos menos idealistas.

Extracto del manual de Diseño Persuasivo de BJ Fogg

En el caso de las redes sociales, el sistema de recompensa variable busca generar estos loops de dopamina con la intención de que no abandonemos las plataformas. Al fin y al cabo, cuanto más tiempo pasemos en ellas más anuncios veremos y por lo tanto más dinero ingresarán gracias a la publicidad. Para crear estos loops utilizan varios recursos, aunque el más importante son las notificaciones constantes.

Las notificaciones pueden ser sonoras, visuales o de movimiento (vibración del móvil) y son la señal para introducirnos en el loop, ya que nos generan la curiosidad necesaria para buscar una recompensa. Sin ellas las redes sociales no atraerían tanto nuestra atención ni conseguirían el comportamiento. Al igual que los monos del experimento de Sapolsky, el chute de dopamina llega a nuestro cerebro al ver la señal y eso nos lleva a la acción. ¿Qué foto habrá subido Miguel? ¿Qué comentario me habrá dejado María? ¿Quién me habrá puesto like? La búsqueda de esas respuestas es las que nos conduce a entrar en el loop.

A partir de las notificaciones, las redes sociales utilizan múltiples recursos para mantenernos en el loop:

> El “pull to refresh”, ese gesto que hacemos con el dedo en el móvil y que se nos pide para refrescar las noticias / tuits / fotos. Su objetivo es imitar el efecto de palanca de la máquina tragaperras, darnos sensación de control y de que la respuesta que buscamos es consecuencia de nuestros actos.

> El scroll infinito en aplicaciones y webs, que consigue que no haya ninguna pista que nos haga pensar que estamos saciados de información. Siempre hay más que leer, más fotos que mirar, más contenido que descubrir. Similar efecto produce el efecto “autoplay” de Youtube o Netflix, que intenta que permanezcamos en un bucle de contenido reproduciendo automáticamente otro vídeo o capítulo.

> El algoritmo que constantemente nos ofrece información relacionada con nuestros intereses, que busca crear nuevas señales de manera más eficaz para introducirnos en el loop.

> El algoritmo que nos muestra que les gusta o les interesa a nuestros amigos, que gracias a la familiaridad genera nuevas señales que atraen nuestra atención.

En el caso de los videojuegos gratuitos como Candy Crush o Clash Royale, el recurso principal que se aplica para generar adicción es el propio diseño de progresión. En los videojuegos clásicos, como el Tetris o el Pac-Man, la forma de conseguir recompensas está fijada desde el principio. En el caso del Tetris la recompensa sucede al hacer una línea completa: ésta desaparece y se libera espacio en la pantalla para nuevas fichas. En el caso del Pac-Man la recompensa aparece al comer las bolas grandes, es entonces cuando podemos eliminar a los fantasmas que nos persiguen. En estos juegos mejoramos simplemente jugando más, es decir, adquiriendo experiencia en los controles y conociendo mejor el sistema. De esta manera avanzamos más y más rápido.

En cambio de un tiempo a esta parte, en la mayoría de los videojuegos las recompensas se ofrecen en forma de “lotería”. Los usuarios progresan por el juego recibiendo “cajas”, “sobres” o “cofres” donde la recompensa es aleatoria en vez de fija. Eso ocasiona que, si se quiere obtener algo en concreto, es la suerte quien decide. ¿Te suena? Exacto, un sistema de recompensa variable de manual. Al introducir impredecibilidad en las recompensas, los jugadores se enganchan buscando ese premio que les falta. ¿Y si me sale en la próxima partida? ¿Y sí es en la siguiente?

Micro-Pagos del Clash Royale: A cambio de dinero real obtienes dinero el juego que sirve, entre otras cosas, para comprar más cofres con recompensas aleatorias

Estos videojuegos suelen ser gratuitos pero la realidad es que si se quiere progresar rápido se necesita pagar. Los famosos micropagos suelen otorgar más intentos en la “lotería”, es decir, más posibilidades de pulsar la palanca de la máquina tragaperras. De ahí que obtengan tantos ingresos a pesar de que el juego sea gratuito. Esta es en realidad la misma estrategia que utilizan los casinos cuanto te ofrecen una cantidad gratuita para empezar a apostar. Los primeros intentos corren de su cuenta porque saben que los siguientes correrán de la tuya.

Y hablando de ofrecer dinero gratis, analizaré brevemente del éxito reciente de las apuestas deportivas. Te habrás fijado que últimamente las casas de apuestas se extienden por los barrios de las ciudades y la mayoría de equipos deportivos son patrocinados por empresas del sector. ¿Qué está pasando? Más allá de una legislación favorable, las apuestas deportivas se han sofisticado y con ello han ganado muchos seguidores. Y cuando hablo de sofisticación me refiero a aplicar las enseñanzas del diseño de las redes sociales y unirlas a un sistema de recompensa variable más complejo.

Primero, las casas de apuestas utilizan las notificaciones constantes para intentar introducirte en los loops de dopamina. “¿Cómo vas a dejar pasar esta oportunidad de ganar dinero fácil en esta apuesta segura?” anuncian una y otra vez. Y además ahora gracias a internet pueden hacerlo en el momento exacto con una apuesta concreta sobre lo que está ocurriendo en ese mismo instante.

Publicidad contextual que ofrece 15€ gratis en la casa de apuestas de Marca en su página donde se sigue el partido en directo. Debajo aparece la cuota de la apuesta para ese mismo partido.

Por otro lado y aún más importante, ahora ya no sólo se apuesta al resultado de un partido, sino que existen decenas o cientos de posibles apuestas: cuántos corners habrá en un partido, quién marcará el primer gol, cuántas tarjetas amarillas sacarán en la primera parte, etc. Casi cualquier cosa que se te ocurra puede ser motivo de apuesta. Con esto han conseguido aumentar enormemente la impredecibilidad y gracias a ello, como ya sabemos, la cantidad de dopamina que cada apuesta nos produce.

Y por último, la llegada del digital a las apuestas deportivas les ha dado una herramienta muy poderosa: la inmediatez. Antes podías apostar a un resultado o echar la quiniela, pero desde que ejecutabas la acción hasta que obtenías el resultado pasaba mucho tiempo. Una de las claves del sistema de recompensa variable es que tras la señal y la acción de la persona, ha de venir inmediatamente la recompensa. Si ésta sucede mucho tiempo después, es complicado que ese comportamiento se repita. Gracias a internet ahora puedes poner dinero en apuestas que se van a resolver en el minuto siguiente. De esta manera generan una gran adicción.

Como puedes ver, el sistema de recompensa variable tiene un origen biológico y una explicación evolutiva, lo que lo hace prácticamente imposible de evitar. Su aplicación a los productos digitales para hacerlos más adictivos se ha popularizado, y aún más con la llegada del smartphone, una herramienta que ha permitido que todos llevemos una máquina tragaperras 24 horas en nuestro bolsillo. No sólo hay que saber reconocerlo para combatirlo, sino que el esfuerzo es enorme porque al fin y al cabo, el enemigo somos nosotros mismos.

> Puedes seguirme en Twitter: https://twitter.com/Hugo_saez
> O suscribirte a mi newsletter semanal en: https://mindtricks.substack.com/

--

--

Hugo Sáez

Escribo sobre marketing, digital y cómo tomamos decisiones. Twitter: https://twitter.com/Hugo_saez / Newsletter cada viernes: https://mindtricks.substack.com/