Paradoja de San Petersburgo
Una nueva visita a la teoría de la utilidad esperada y las aparentes contradicciones que aparentemente viene a resolver.
[Este texto es parte del libro Abrazar el azar]
Podés conseguirlo acá.
Ese 9 de septiembre, Nicolás se despertó inspirado. El verano ya estaba en
retirada en Basilea y, junto con él, los últimos días cálidos de 1713. Nicolás
estaba de buen temple. Ese año había logrado publicar finalmente los escritos que dejó su tío Jacob al morir ocho años atrás, aunque los textos eran anteriores a 1690. Tuvo buen ojo al considerar que sería valioso publicarlos. El trabajo contenía obras de personajes como Christiaan Huygens, Gerolamo Cardano, Pierre de Fermat y Blaise Pascal, pero, sobre todo, guardaba la primera versión de la ley de los grandes números, que se convertiría en el escrito fundacional y fundamental de la teoría de probabilidades. Lo llamaron Ars Conjectandi.
Nicolás no era solo un editor. Era un matemático de fuste y, como tal, las
tareas de edición no lograban colmar sus intereses. Así que ese día decidió enviarle una misiva a Pierre Rémond de Montmort pidiéndole que se imagine un experimento mental en donde un dado es arrojado una y otra vez hasta obtener un 6, para luego preguntarle:
¿Cuál es la esperanza de B… si A promete darle a B una cantidad de mo-
nedas acorde con la siguiente progresión 1, 2, 4, 8, 16, etc.; o 1, 3, 9, 27, etc.; o 1, 4, 9, 16, 25, etc.; o 1, 8, 27, 64 en lugar de 1, 2, 3, 4, 5, etc. como antes? A pesar de que la mayor parte de estos problemas no son difíciles, encontrará algo curioso.
La progresión refiere a la cantidad de lanzamientos del dado necesarios para obtener un 6). Entonces, la progresión 1, 2, 4, 8, 16 indica que se paga 1 moneda si sale el 6 en el primer lanzamiento, 2 monedas si sale en el segundo, 4 monedas si sale en el tercero, etc.
Unos días después, don Pierre Montmort le respondió diciéndole que no hay dificultad alguna en el problema que plantea y que que puede ser resuelto fácilmente utilizando el método que dio su tío para encontrar la suma de estas series.
Nicolás, con cara indisimulable de ancho de espadas le retrucó:
¿Probaste hacerlo?
Quince años después, Nicolás recibió una carta de Gabriel Cramer, quien le cuenta que su problema puede ser simplificado sin perder el interesante punto que trata y le propone el siguiente:
El jugador A tira una moneda al aire reiteradas veces hasta obtener una cara. El jugador B le dará a A 1 moneda si obtiene la cara en el primer lanzamiento, 2 si la obtiene en el segundo, 4 si la obtiene en el tercero, 8 si la obtiene en el cuarto, etc. ¿Cuánto debería pagar A para jugar este juego de modo que sea justo?
Allá por 1713, el consenso general desde Fermat y Pascal era que la respuesta estaba en la esperanza. Para todo juego de azar que implique una ganancia aleatoria para el jugador, el precio justo a pagar por jugar ese juego es la ganancia esperada, es decir, calcular la probabilidad de obtener cada posible valor de ganancia, multiplicarlo por la ganancia obtenida en ese caso y sumar todo. Concretamente, si llamamos x1 , x2 , . . . a las posibles ganancias y p1 , p2 , . . . a sus respectivas probabilidades, la ganancia esperada es
Acuérdense que al final del capítulo anterior ya hicimos esta cuenta para el juego de la ruleta y nos dio − 1/37.
Hagamos ahora la tarea que le quedó sin hacer a de Montmort. La probabilidad de que salga cara por primera vez en el primer lanzamiento es 1/2, que eso pase en el segundo es 1/4 (tiene que salir ceca en el primer lanzamiento y cara en el segundo), en el tercero es 1/8 (tiene que salir ceca, ceca, cara), etc. Repasando la consigna de Cramér, nos da que la ganancia esperada es
Infinito! Y ahora te pregunto, mi querido lector, como se preguntaron Nicolás, su primo Daniel, Gabriel Cramér y tantos otros (el tío Jacob no porque ya había pasado a mejor vida y de Montmort tampoco porque no hizo la tarea).
¿Cuánto estás dispuesto a pagar para participar de este juego?
Nicolás opinaba que “no debería existir ni una persona medianamente sensible que no esté dispuesta a vender el derecho a jugar a este juego por 40 ducados (por juego)”. Vender el derecho a jugar significa ser la banca. Eso quiere decir entonces ponerse un puestito en la feria con un cartel que diga
y hacerse cargo de pagar lo que dictan las reglas del juego.
Nicolás tenía un buen punto. Algo raro había con este juego. De acuerdo al criterio aceptado, la ganancia esperada debía representar cuánto estaría dispuesto a pagar una persona por participar del juego. O equivalentemente a cuánto estaría dispuesta una persona a vender el derecho a jugar. Pagar por debajo de ese monto debería ser beneficioso para el jugador y pagar por encima de ese monto debería ser beneficioso para la banca. Pero en este caso la ganancia esperada da infinito y, si lo dicho anteriormente es correcto, deberíamos estar dispuestos a pagar cualquier cantidad para participar de este juego ya que luego ganaremos infinito. Pero como dice Nicolás, nadie medianamente sensible está dispuesto a pagar más que algunas monedas por el derecho a jugar. Equivalentemente, nadie debería estar dispuesto a vender el derecho a jugar a este juego por más dinero que le ofrezcan, ya que la ganancia esperada del jugador será infinita. ¿Dónde está el problema?
Cramér tiró las primeras pistas, pero fue el primo Daniel quien, de paso por San Petersburgo en 1738 publicó un artículo en los Comentarios de la Academia Imperial de la ciencia de San Petersburgo con una posible solución. La solución de Daniel se convirtió en los inicios de la Teoría de Utilidad Esperada y fue tremendamente influyente en economía, teoría de juegos y teoría de la decisión de ahí en adelante.
Al día de hoy no hay una única explicación universalmente aceptada para resolver la paradoja. La más destacada es la del primo Daniel y Cramér, posiblemente no tanto por la forma en que intentan resolver la paradoja sino porque dio lugar a una teoría que con adeptos y detractores, se hizo de un lugar muy importante dentro de las ciencias económicas y la teoría de la decisión.
Esencialmente se basa en considerar que la ganancia esperada no es la medida justa para valuar un juego y propone la introducción de funciones de utilidad. Una función de utilidad U determina cuál es el valor que le da un agente particular a una ganancia determinada. Entonces para una ganancia de x, U(x) representa el valor que le da el agente a x. De ser esto así, para evaluar la conveniencia o no de intervenir en un juego debemos considerar los posibles valores de U(x) más que los de x. Entonces reemplazamos la idea de ganancia esperada por utlidad esperada
y la calulamos como antes pero reemplazando a x por U(x). Es decir, consideramos todos los posibles valores de U(x), los multiplicamos por su probabilidades respectivas y sumamos todo
Daniel propuso usar funciones de utilidad con esta pinta
y mostró que si uno considera funciones como esta, por ejemplo el logaritmo en base 2, la utilidad esperada es un número finito y que — según él argumenta- representa el valor que uno debería estar dispuesto a pagar para participar del juego. Tener una función de utilidad que sea como el logaritmo en base 2 signifca que valoramos x ganar 2^x, ya que el logaritmo es una función que cumple justamente que el logaritmo en base 2 de 2^x es x.
O sea que si nuestra alegría por recibir $2 es 1, por recibir $4 es 2, por recibir $8 es 3, por recibir $16 es 4, etc., podemos volver a hacer las cuentas y obtenemos
Esta suma, más allá de tener infinitos términos (como mostró Daniel con las técnicas del tío y mostraremos nosotros en el apéndice), da una número finito. No solo eso, puede demostrarse que da exactamente 1. Si ya hiciste un curso de cálculo o probabilidad de nivel universitario, te invito a hacer la cuenta. Si no es tu caso, te pido que me creas -por ahora- o que vayas al apéndice, donde vas a encontrar la cuenta ya hecha.
¡Listo! Asunto terminado. Gracias Daniel, gracias Cramér. ¿Usamos funciones de utilidad y damos por cerrado el asunto…?
… no tan rápido.
Más allá de qué tanto nos guste esta solución, la introducción de funciones de utilidad produjo una revolución en el estudio del riesgo y la teoría económica. Recibió muchas críticas en los años subsiguientes y al día de hoy continúa recibiéndolas. Pero no sería bueno confundir las virtudes o defectos de la solución de Daniel con las de la teoría que esta desató. De la misma forma, tampoco debemos soslayar el tremendo impacto y aceptación que tuvo.
Una de las críticas a esta solución es que una vez fijada la función U*, pueden cambiarse las probabilidades para que la utilidad esperada de infinito de todos modos. O sea, fijada la función de utilidad U, podemos diseñar un juego en el que la utilidad esperada da infinito pero que nadie estaría dispuesto a pagar cantidades arbitrariamente grandes por jugar.
Supongamos que en lugar de tirar una moneda y contar la cantidad de lanzamientos necesarios hasta obtener una cara, tenemos un juego en el cual la probabilidad de que salga x (y por lo tanto el pago sea 2^x ) es 1/x^2 .
Bueno, eso no es posible porque resulta que si sumamos
no da 1. Leonhard Euler demostró que esta suma da exactamente π^2 /6. Pero entonces si sumamos
Así que con estas probabilidades sí que podemos. Entonces tenemos un juego que da como resultado x con probabilidad 6/(π²x²). Es decir que sale 1 con probabilidad 6/π², sale 2 con probabilidad 6/4π², etc.
Ahora tenemos que calcular la utilidad esperada de este juego (con nuestra función de utilidad!)
Es decir que
Esta suma es muy conocida. Se la denomina Serie Armónica y en el apéndice pueden encontrar un demostración elemental de que da infinito.
Y ahora, mi querido lector averso al riesgo. Si esta fuera tu función de utilidad (no valorás mucho una gran suma de dinero si eso conlleva un riesgo),
¿cuánto estarías dispuesto a pagar por participar de este juego?
Posiblemente más que antes, pero ¿cuánto? ¿Pagarías diez mil millones de pesos? Si nosotros tenemos una función de utilidad, esa no debería depender del juego. La función de utilidad solo representa el valor que le damos al dinero. Con esta función de utilidad este juego también tiene una utilidad esperada que da infinito pero seguimos sin estar dispuestos a ofrecer enormes cantidades de dinero por la oportunidad de jugarlo.
Lo siento mucho Daniel, c’è qualcosa che non va. El hecho mismo de introducir a las funciones de utilidad, no parece del todo satisfactorio ya que no resuelve el problema de raíz. Al introducir esta función dejamos
de tener el problema que teníamos, pero suena más a un antitérmico, para bajar la fiebre que una solución a la causa de la misma.
Pasen señores, traigan su solución.
Cada cual tiene su solución preferida paraeste problema, la lista de los que dieron su propia versión sobre el asunto incluye a Buffon , d’Alambert, Poisson, Bertrand, Euler y Keynes, pero es mucho más extensa. La mayoría centra sus reparos en el uso del infinito, siendo que la duración de nuestras vida, las fortunas, la riqueza total en el mundo, etc. son finitas. Yo acá
les voy a dejar una que me gusta a mí y que se la debemos a un personaje muy importante de la probabilidad del Siglo XX, el Señor William Feller. A diferencia de sus predecesores, Feller en lugar de quejarse por el uso del infinito, se hace amigo de él.
Lo primero que debemos preguntarnos para tratar de entender el problema en el que estamos (suele pasar que los grandes avances en la resolución de problemas en matemática, se dan a través de las buenas preguntas; una buena pregunta puede valer mucho más que una respuesta correcta) es por qué la ganancia esperada, o la utilidad esperada, deberían reflejar el precio justo para participar de un juego.
La respuesta está en la ley de los grandes números del capítulo 3. Vamos a escribirla nuevamente con un poco de notación matemática porque nos va a ayudar. En nuestro contexto esta ley dice: supongamos que participamos de un juego cuya ganancia es aleatoria y llamamos E a la esperanza o ganancia esperada. Hagamos el experimento mental de jugar muchas veces a ese juego, siempre en las mismas condiciones y en forma “independiente” (cada vez que jugamos, los resultados de los juegos anteriores no influyen en nada). Vamos a llamar X1 a la ganancia
obtenida la primera vez que jugamos, X2 a la ganancia obtenida la segunda vez que jugamos, etc. y vamos a usar Sn para la ganancia acumulada en las primeras n repeticiones del juego. O sea,
La ley de los grandes números del capítulo anterior dice que Sn /n tiende a E a medida que n se hace cada vez más y más grande. Entonces tiene algo de sentido pensar a E como el precio justo para participar del juego: si jugamos muchas veces, nuestra ganancia promedio será E por cada juego jugado. Pero ¡attenti! Hay que jugar muchas veces. Si jugamos una sola vez, E no es informativo. Al menos no lo es así solita. En principio esta ley es para cuando E es un número finito. En la paradoja de San Petersburgo E es infinito, pero puede demostrarse que en este caso la ley de los grandes números sigue valiendo. Es decir que si ahora nuestro juego es el propuesto por Nicolás y G. Cramér, podemos asegurar que Sn /n tiende
a infinito. Concretamente, toma valores cada vez más y más grandes a medida que va creciendo n. Feller se ocupó de demostrar un resultado más sutil. Si llamamos N = 2^n, entonces
Esta expresión quiere decir que a medida que n se hace cada vez más y más grande (muchos juegos), S_N /(N × n) se aproxima a 1. Entonces, la ganancia promedio que se obtendrá por jugar N veces a este juego está próxima (cuando n es muy grande) a n. Ciertamente esta cantidad tiende a infinito cuando n tiende a infinito pero lo hace muy depacito. Por ejemplo, si jugamos 1024 = 2¹⁰ veces, la ganancia promedio estará próxima a 10 monedas por juego. Ese es el precio justo por jugar 1024 veces. Para que 20 monedas (por juego) sea un precio justo, se nos debe permitir jugar a este juego 2²⁰= 1.048.576 veces (y debemos tener la cantidad de monedas necesarias para poder hacerlo!).
Entonces no hace falta introducir funciones de utilidad ni nada de eso que suena a parches y que da lugar a tantos problemas. Solamente hay que ir a buscar en lo profundo del significado de cada objeto y sus propiedades. La ganancia esperada es un objeto que representa muy bien el valor de un juego cuando lo jugamos infinitas veces. Pero así solita, poco dice sobre qué ocurre cuando jugamos unas pocas veces. Y como ya vimos, cuando se trata del infinito, conviene andar con cuidado.
¡Ah! El tío Jacobo, autor de Ars Conjectandi, y los primos Nicolás y Daniel, autores del problema y solución de San Petersburgo respectivamente, son solo algunos de los notables matemáticos de la familia Bernoulli, con más de catorce exponentes.
- La función U debe poder tomar valores arbitrariamente grandes para valores de ganancias muy grandes. Es decir si U toma un valor máximo y sin importar cuando valga la ganancia U nunca supera a ese valor máximo, lo que sigue no aplica.