2 formas de usar muestras pequeñas para tomar mejores decisiones

Juan Betancourt
Articulos para emprendendedores
9 min readJul 19, 2020

by Joey Beachum | Nov 6, 2018 en www.hubbardresearch.com

Cuando se trata de estadísticas, hay muchas ideas falsas flotando. Incluso las personas que tienen un background científico son susceptibles a algunos de estos conceptos erróneos comunes. Una idea errónea que afecta la medición en prácticamente todos los campos es la percepción de que se requiere una muestra de gran tamaño antes de poder obtener información útil de una medición.

Las mediciones a menudo se descartan, sin hacer ningún cálculo real, porque alguien cree que necesita un tamaño de muestra más grande para ser “estadísticamente significativo”. Vemos ejemplos de esta forma de pensar en todas partes. En los deportes, por ejemplo, descartamos las métricas predictivas porque funcionan naturalmente con tamaños pequeños de muestras (una temporada es tan larga, con solo tantos juegos, después de todo), prefiriendo en su lugar confiar en el “instinto” y el “conocimiento experto”.

En otras palabras, una medición no es inútil si el tamaño de la muestra es pequeño. En realidad, puedes usar tamaños de muestra pequeños para aprender algo útil sobre cualquier cosa, incluso, como veremos pronto, con muestras realmente pequeñas .

Y si puedes aprender algo útil utilizando los datos limitados que tienes, estas un paso más cerca de medir cualquier cosa que necesites medir, y así tomar mejores decisiones. De hecho, es en esas situaciones donde hay mucha incertidumbre, en las que unas pocas muestras pueden reducir la incertidumbre al máximo. En otras palabras, si no sabes casi nada, casi cualquier cosa te dirá algo.

En How to Measure Anything: Finding the Value of Intangibles in Business, Doug Hubbard utiliza 2 principios estadísticos que no suelen aparecer en el radar para demostrar cómo incluso pequeñas cantidades de datos pueden proporcionar una gran cantidad de información útil: la regla de los cinco y la urna del misterio.

La Regla de los 5

Imagina por un momento que eres el que toma las decisiones para una gran corporación con 10,000 empleados. Estás considerando automatizar parte de alguna actividad rutinaria, como programar reuniones o preparar informes de estado. Pero enfrentas mucha incertidumbre y crees necesitar reunir más datos. Específicamente, un dato que estás buscando es la cantidad de tiempo que el empleado promedio pasa cada día viajando.

¿Cómo reunirías esta información?

Podrías crear un censo lo que esencialmente sería una encuesta a cada uno de los 10,000 empleados. Pero eso sería costoso y llevaría mucho trabajo. Probablemente no quieras pasar por ese tipo de problemas. Otra opción es obtener una muestra, pero no estas seguro de cuál debería ser el tamaño de la muestra para que sea útil.

¿Qué pasaría si te dijera que podrías obtener suficiente información para argumentar una decisión al tomar una muestra de solo 5 personas?

Digamos que eliges al azar a 5 personas de tu empresa. Por supuesto, es difícil para los humanos ser completamente aleatorios, pero supongamos que el proceso de selección fue lo más aleatorio posible.

Luego, digamos que le pides a estas 5 personas que te den el tiempo total en minutos que pasan cada día en esta actividad. Los resultados vienen en 30, 60, 45, 80 y 60 minutos. A partir de esto, podemos calcular la mediana de los resultados de la muestra o el punto en el que exactamente la mitad de la población total (10,000 empleados) está por encima de la mediana y la otra mitad por debajo de ella.

¿Es eso suficiente información?

Muchas personas, cuando se enfrentan a este escenario, dirían que la muestra es demasiado pequeña, que no es “estadísticamente significativa”. Pero mucha gente no sabe lo que significa realmente estadísticamente significativo.

Volvamos al escenario. ¿Cuáles son las posibilidades de que el tiempo medio empleado en esta actividad para 10,000 empleados esté entre 30 y 80 minutos, los extremos bajo y alto, respectivamente de la encuesta a los 5 empleados?

Cuando se les pregunta, la gente suele decir en algún lugar alrededor del 50%. Algunas personas incluso van tan bajo como 10%. Tiene sentido, después de todo; Hay 10,000 empleados e innumerables tiempos de viaje individuales en un solo año. ¿Cómo puede acercarse una muestra que no se considera estadísticamente significativa?

Bueno, aquí está la respuesta: las posibilidades de que la mediana del tiempo que invierte la población de 10,000 empleados esté entre 30 y 80 minutos es un asombroso 93.75%.

En otras palabras, puedes estar muy seguro de que el tiempo medio empleado es de entre 30 minutos y 80 minutos, simplemente preguntando a 5 personas de las 10.000 (o 100.000 o 1.000.000, son todas las mismas matemáticas).

Esto puede parecer un rango amplio, pero ese no es el punto. El punto relevante es si este rango es más estrecho que tu rango anterior. Tal vez pensabas anteriormente que entre 5 minutos y 2.5 horas por día eran razonables dado lo que sabías en ese momento. Ahora es muy poco probable que estos valores sean medianas para la población. Incluso con una pequeña medición de solo 5 personas, reduces significativamente tu rango de incertidumbre. Si tu incertidumbre era tan alta antes, ahora tienes una idea mucho mejor.

Ahora supón que el punto de equilibrio de la inversión propuesta a partir del tiempo medio empleado de 10 minutos por persona por día. Es decir, si el tiempo medio empleado es superior a 10 minutos, la inversión propuesta será mejor que el punto de equilibrio. En este caso, ya has reducido la incertidumbre lo suficiente como para confiar en la decisión de invertir. Del mismo modo, te sentirias seguro de rechazar la inversión si el punto de equilibrio fuese de 2 horas. Si tu punto de equilibrio es, digamos 45 minutos, podrías considerar tomar más muestras antes de tomar una decisión.

Por lo tanto, tomar mejores decisiones se trata de obtener información valiosa a partir de la medición de datos. Pero no se necesitan muchos datos para darte algo útil con lo que trabajar.

¿Qué pasaría si pudieras aprender algo útil con aún menos información?

La urna del Misterio

Imaginate en un almacén. Frente a ti hay un hombre: diremos que está vestido con un traje de feria, completo desde el elegante abrigo rojo hasta el sombrero de copa y una mirada pícara en su rostro. (Esto está muy lejos de tu entorno habitual de oficina corporativa).

El sujeto agita el brazo hacia el interior del almacén. Ves filas y filas de urnas grandes. Intentas contarlas, pero siguen yendo y entrando en los recovecos oscuros del almacén.

“Cada urna”, te dice, “está llena de canicas, digamos 100,000 canicas por urna, cada canica en estas urnas es roja o verde, pero, la mezcla de canicas rojas y verdes varía de urna a urna. Una urna podría tener 100% canicas verdes y 0% canicas rojas o 33% de canicas verdes y 67% de canicas rojas o podría ser una división pareja 50–50, o cualquier otra opción entre 0 a 100%. Todos los porcentajes son igualmente probables. Y supongamos que las canicas en cada urna se han mezclado a fondo y al azar”.

El sujeto continúa. “Esta es mi propuesta: Haremos un juego de apuestas, eligiendo una urna al azar. Entonces, apostaré a que las canicas en esa urna son en su mayoría rojas o en su mayoría verdes. Te daré un chance de 2 a 1 y cada vez que apostaras $ 10. Es decir, si supongo correctamente, pierdes $ 10. Si me equivoco, ganarás $ 20. Jugaremos a través de 100 urnas. ¿Quieres apostar? pregunta con una sonrisa.

Sabes que si es una distribución uniforme, donde todos los porcentajes son igualmente probables, el sujeto tendrá razón el 50% del tiempo. Eso significa que tu ganancia promedio por apuesta es de $ 5 (una probabilidad del 50% de perder $ 10 y el 50% de ganar $ 20 = (0.5) (- 10) + (0.5) (20) = 5). Entonces, con más de 100 urnas, obtendrás alrededor de $ 500 — más o menos $ 100 — al final del juego. Suena como una apuesta inteligente.

“De acuerdo”, dices.

“Bueno, hagámoslo un poco más justo para mí”, dice el sujeto. “Permíteme retirar una canica elegida al azar de una urna antes de hacer mi elección. Esto será completamente al azar. Hay una válvula especial en la parte inferior que me dará una canica única sin permitirme ver el resto. ¿Seguirías jugando conmigo?

Probablemente eres como la mayoría de la gente al pensar que una canica pequeña en una urna grande llena de canicas no va a importar. Es un tamaño de muestra demasiado pequeño, ¿cierto?

“De acuerdo”, dices, y el sujeto sonríe porque sabe que te tiene.

La mayoría de la gente piensa que la información adicional no ayuda en lo absoluto o proporciona en el mejor de los casos una pequeña ventaja marginal (que ganará el 51% del tiempo en lugar del 50%, o algo así. Después de todo, hay 100,000 canicas).

Si todavía tienes un chance de 2 a 1, el 51% no es muy diferente del 50%. Aún ganarás.

¿Conoces la nueva probabilidad de ganar del sujeto? Lo creas o no, al tomar solo una muestra de cada urna, su probabilidad de acertar salta del 50% al 75%. Eso es un aumento del 50% así que en realidad te despedirias del juego como un perdedor.

Esto se llama la Regla de la Mayoría de la Muestra Única, que dice formalmente: “Dada la máxima incertidumbre sobre una proporción de la población, de tal manera que crees que la proporción podría ser entre 0% y 100% con todos los valores igualmente probables, hay un 75% posibilidad de que una sola muestra seleccionada aleatoriamente pertenezca a la mayoría de la población”.

Ahora tienes un insight accionable, más de lo que tenía antes de comenzar. Con una muestra simple, mejor alejarse de esta apuesta.

Aplicando estos principios para medir cualquier cosa

Lo que te enseñan la Regla de los 5 y la Urna del Misterio es esto: cuando intentas medir algo, suponiendo que tus métodos son sólidos, te estás dando más data accionable para tomar buenas decisiones que siempre es mejor que seguir la intuición o un presentimiento.

Nuestra intuición a menudo es incorrecta cuando se trata de estadísticas y análisis cuantitativos. No podemos creer que se pueda obtener algo útil de un tamaño de muestra pequeño y luego está el tema de la significancia estadística.

Este es el tema: cuando mides algo, reduces la incertidumbre, lo cual es lo mejor que puedes hacer para tomar una decisión acertada. Y cuando tienes mucha incertidumbre (por ejemplo, en el caso de las urnas donde la proporción de canicas de un color específico podría estar entre 0 y 100%), incluso la primera muestra aleatoria puede reducir mucho la incertidumbre.

Sin embargo, el primer paso es ser consciente que tu intuición sobre estadística, probabilidad, matemática y análisis cuantitativo probablemente sea incorrecta. Existen ideas erróneas que te impiden tomar mejores decisiones a través de la medición y el análisis de datos. Los que toman decisiones lidian con estos conceptos erróneos todo el tiempo, y el resultado es que no están tomando las mejores decisiones que potencialmente podrian.

Si puede superar la intuición cruda o “presentimiento”, como confían muchos tomadores de decisiones y expertos, y te aferras a el análisis cuantitativo de decisiones, puedes recopilar más información incluso utilizando tamaños de muestra ridículamente pequeños como en la Regla de los Cinco o Urna del misterio.

Sin embargo, no tengas miedo de no saber qué medir. David Moore, ex presidente de la Asociación Americana de Estadística, dijo una vez: “Si no sabes qué medir, mide de todos modos, eventualmente aprenderás qué medir. Doug llama a esto el método Nike: la escuela de pensamiento “Just do it”.

No necesitas un tamaño de muestra grande para comenzar a medir algo, incluso un intangible que crees imposible de medir. Incluso con un tamaño de muestra pequeño, puedes reducir tu rango de incertidumbre y, por lo tanto, puedes tomar mejores decisiones.

Esta es una traducción del artículo original “TWO WAYS YOU CAN USE SMALL SAMPLE SIZES TO MEASURE ANYTHING” de Joey Beachum en el blog de hubbardresearch.com

--

--

Juan Betancourt
Articulos para emprendendedores

Entrepebeliever & change maker, explorando nuevos modelos virtuosos de vinculación entre los negocios y el talento humano.