Teorema de la cerveza

Pablo Groisman
Te regalo un teorema
4 min readDec 11, 2022

Si las observaciones son normales e independientes, las desviaciones de la media muestral, medidas en desvíos estándar muestrales, siguen una distribución t de Student con n-1 grados de libertad.

[Este texto forma parte del libro Te Regalo un teorema, de Pablo Groisman & Gofel]

Conseguir Te regalo un teorema

Spoiler: tiene que ver con el p-valor y el t-test para comparar medias de dos poblaciones cuando la muestra es chica. Toda una declaración en tiempos de big data.
El enunciado es bastante técnico y requiere haber pasado por un curso de probabilidad o estadística para entenderlo, pero si no es tu caso, te cuento de qué se trata. Este teorema se usa un montón cuando se quiere hacer estadística con pocos datos. Algo que sucede en muchísimas disciplinas, desde biología y medicina hasta economía y otras ciencias sociales, pasando en el medio por todo lo que te puedas imaginar. De hecho, esta es una de las herramientas principales que han tenido la medicina y las ciencias naturales para avanzar a lo largo de muchos años, y lo sigue siendo.

La ciencia típicamente avanza a través de experimentos y busca sacar conclusiones a partir de ellos. Pero ¿cómo saber si lo que observamos como resultado de nuestro experimento y parece ser un gran descubrimiento es producto de la casualidad o realmente hay un fenómeno novedoso subyacente que hemos descubierto y explica lo que vemos? La estadística aparece ahí para socorrernos. En innumerables situaciones desde su aparición, lo hace a través de la t de Student que usamos para hacer tests de hipótesis y calcular p-valores cuando tenemos pocos datos. Por estos tiempos, mucha gente cree que podemos disponer de muchos datos para responder a cualquier pregunta. Pero eso está muy lejos de ser cierto. Big data mal entendido. Seguimos teniendo muchas preguntas para las cuales simplemente no tenemos los datos necesarios para responder. Y muchas otras para las que cada dato que podamos generar para intentar responderlas cuesta. Cuesta plata, cuesta tiempo, cuesta cuerpos, cuesta tratamientos invasivos, cuesta experimentos costosos. Entonces queremos tratar de responder utilizando pocos datos.
William S. Gosset, el protagonista de esta historia, trabajaba en la fábrica de cervezas Guinness, donde intentaban descubrir cuáles eran los mejores tipos de cebada, temperaturas y procesos para hacer malta (y luego cerveza, claro). Sus muestras eran pequeñas porque cada muestra era costosa, onda plantar toda una parcela. La pregunta que se hacía Gosset era qué tan bien representa el desvío estándar muestral, que calculamos con nuestros datos, al desvío estándar poblacional, que representa la variabilidad intrínseca del fenómeno, cuando la muestra es pequeña.
El desvío estándar mide qué tan dispersos son los valores de nuestro interés. En una sociedad muy desigual, el desvío estándar de los ingresos familiares es muy grande, en una sociedad más igualitaria ese desvío
estándar es más pequeño. En un curso en donde todos tienen un nivel similar, el desvío estándar de las notas es pequeño; en un curso con niveles muy disímiles, el desvío estándar de las notas es grande. El desvío estándar poblacional se refiere al de toda la población, mientras que el muestral corresponde a tomar una muestra de esa población y mirar el desvío estándar dentro de esa muestra.

La verdadera pregunta de Gosset no era sobre los desvíos estándares, sino que necesitaba entenderlos para responder cómo hacer para decidir con pocas observaciones si las diferencias en las medias muestrales de los resultados de dos tipos de procesos distintos se debían al azar o a que había una diferencia real producida por los diferentes procesos. Así que Gosset se fue de sabático a Londres a ver al gran estadístico de la época, Karl Pearson.
Los inicios del siglo XX fueron un momento de gran auge para la estadística matemática, con epicentro en Gran Bretaña, de la mano de Galton, Pearson, Fisher y Gosset. Gosset, con la ayuda de Pearson, descubrió la
distribución t de Student y publicó sus descubrimientos en un artículo* que firmó con el seudónimo “Student”, porque Guinness les prohibía a sus empleados publicar artículos científicos.
Ahí Gosset propone el t-test, y tira frases como:

Nuevamente, aunque es bien sabido que el método de usar la curva normal solo es confiable cuando la muestra es grande, nadie nos ha dicho todavía con claridad dónde se debe trazar el límite entre muestras ’grandes’ y ‘pequeñas’.

El artículo es impresionante porque dista muy poco de lo que podemos ver 110 años más tarde en manuscritos donde se quiere comparar la media de dos poblaciones (dos tratamientos, por ejemplo) distintas.
A pesar de que Gosset descubrió la distribución de Student y su relevancia, la prueba del teorema no le pertenece. Se la debemos a Ronald Fisher, que pudo demostrarlo gracias a pensar una muestra de tamaño n como un único punto en un espacio de dimensión n. ¡Alta idea!

Si no entendiste esta última frase, no te hagas demasiado drama. ¿Sabés quién más no la entendió? Seguí leyendo y te vas a enterar.

Fisher le mandó la prueba por correo a Gosset, y este no tuvo mejor idea que hacerle un retweet con comentario a Pearson agregando: “Estimado Pearson: Le adjunto una carta que da una prueba de mis fórmulas para la
distribución de frecuencia de z (= x/s), donde x es la distancia de la media de n observaciones de la media general y s es la desviación estándar de las n observaciones. ¿Le importaría mirarla por mí? No me siento cómodo en más de tres dimensiones, incluso si pudiera entenderla más allá de eso”.

* https://bit.ly/2kp2AUI.

--

--

Pablo Groisman
Te regalo un teorema

Math. Probability. CONICET. Exactas at University of Buenos Aires. #TeRegaloUnTeorema