El teorema que no me creí hasta que lo comprobé (la ley de los números anómalos).

Vivimos entre números. Algunos de ellos nos representan, como el DNI, nos indican nuestro teléfono, el lugar dónde vivimos, el coche que conducimos, la edad que tenemos… vale, hasta aquí nada nuevo. Pero, ¿Y si os dijera que entre todos esos números, que parecen dispuestos al azar… no lo están?

Now, let me to introduce… ¡La ley de Bendord!

La ley de Benford tiene muchos nombres: ley de Benford, ley de los números anómalos, ley de los primeros números, ley del primer dígito… ¿Qué es?

Es algo a lo que le tengo un cariño especial, ya que, la primera vez que lo leí, pensé: “no puede ser cierto”. Y tuve que comprobarlo yo mismo, y aún habiéndolo hecho, no salía de mi asombro. Vamos al lío:

Consideremos 9 dígitos:

1, 2, 3, 4, 5, 6, 7, 8, 9.

Vale, hasta aquí, todo bien. La probabilidad de elegir uno en concreto sería de un 11.11%, ya todos los números tienen la misma probabilidad de ser elegidos. No hemos considerarnos el cero porque vamos a quedarnos con el primer número de una secuencia de dígitos, y el primer número, nunca será el cero.

Ahora, imagina que coges un libro al azar, y te quedas con el primer número que veas. Puedes hacerlo si tienes cualquier libro, revista o catálogo al lado.

Yo acabo de hacerlo, y me ha salido “29.95€”. Vamos a quedarnos con la primera cifra, es decir, el 2.

Pues, podríamos pensar que la probabilidad de que salga el 2 es del 11.11%, como hemos dicho antes… ¡Pues no!

La ley de los números anómalos dice que la probabilidad de que el primer dígito sea el 1 es del 30%. ¿Cómo? ¡Es más del doble!

¡Pues hay más! Resulta que las probabilidades siguen una escala logarítmica, y son las siguientes:

1=30%, 2=17.6%, 3=12.5%, 4=9.7%, 5=7.9%, 6=6.7%, 7=5.8%, 8=5.1%, 9=4.6%

Vale… ¿De dónde ha salido todo esto? En 1881, el matemático Simon Newcomb se dió cuenta de que las primeras páginas de las tablas de logaritmos estaban más usadas que las últimas, y dedujo que los dígitos iniciales de secuencias aleatorias de números, no son equiprobables, es decir, algunos aparecen más que otros. Newcomb enunció la llamada ley logarítmica, que dice que: “la ley de probabilidad de la ocurrencia de números es tal que las mantisas de sus logaritmos son equiprobables”. Pero ahí se quedó, de forma verbal.

En 1938, el físico Frank Benford se dió cuenta de lo mismo al usar las tablas de logaritmos, y sin conocer las observaciones de Newcomb, se puso a investigarlo: recopiló un total de 20.229 números distintos. Los sacó de los datos que tenía a mano: constantes físicas y químicas, algunas funciones matemáticas, la cantidad de lluvia que había caído cada mes en su ciudad, los números de domicilio de sus compañeros, algunos números que veía en las portadas de revistas, alturas de montañas, longitudes de ríos…, y a partir de los resultados, Benford postuló una “ley de los números anómalos” para la probabilidad de que el primer dígito sea d. Esta ley logarítmica se conoce como “ley de Benford”.

¿Sigues sin creerlo? ¡Yo tampoco!

Y aquí es cuando me dije: Pedro, tienes que comprobarlo.

Así que fuí a la base de datos del Instituto de Nacional de Estadística de España (INE), y me descargue la base de datos más grande que encontré: el censo de población de todos los pueblos de España de 2016, dividido por sexos.

Pues ordené todos esos datos en un excel . Eran 16.254 números distintos, así que el resultado, debería salir similar al de Benford. Mediante la función “IZQUIERDA(CASILLA;1)”, me quedaba con el primero de los dígitos de cada uno de los datos, y luego, sumaba cuantas veces se repetía cada uno. Obtuve 3 resultados: Sólo hombres, sólo mujeres, y mixto. Adjunto el resultado para comparar con el de Benford, con precisión de 1 cifra decimal.

BENFORD (20229 datos):
1=30%, 2=17.6%, 3=12.5%, 4=9.7%, 5=7.9%, 6=6.7%, 7=5.8%, 8=5.1%, 9=4.6%
RESULTADO HOMBRES (8127 datos):
1=30.7%, 2=17.1%, 3=12.3%, 4=9.6%, 5=8.3%, 6=6.9%, 7=5.6%, 8=4.9%, 9=4.6%
RESULTADO MUJERES (8127 datos):
1=29.9%, 2=17.3%, 3=12.7%, 4=9.9%, 5=8.1%, 6=6.5%, 7=5.6%, 8=5.0%, 9=4.9%
RESULTADO TOTAL (16254 datos):
1=30.5%, 2=17.9%, 3=12.4%, 4=9.1%, 5=7.9%, 6=6.9%, 7=5.7%, 8=4.9%, 9=4.7%

Y aquí es cuando yo me quedé con la boca abierta. Funcionaba.

Como podeis ver, si comparamos resultados, los de Benford con el resultado total son prácticamente iguales. La diferencia no supera en ningún caso el 0.5%. Os dejo aquí el archivo en EXCEL con todos los datos para que podáis trastear con él y comparar todos los datos, tendréis el enlace al final.

Además, esta ley, que ya sí se ha estudiado bastante más, tiene algunas propiedades únicas. Por ejemplo, si cogemos todos los datos que teníamos antes y los multiplicamos por cualquier otro número (distinto de cero)… ¡La ley se sigue cumpliendo!

¿Y tú? ¿Qué te ha parecido la ley de los números anómalos? ¿Te animas a comprobar que se cumple en algún conjunto de datos?

EDIT: He añadido un segundo archivo EXCEL comparando los datos de poblaciones de 2016 e históricos de Cáceres, Badajoz, Extremadura e incluso datos al azar, para que veáis como funciona esta ley. Como siempre, se puede acceder a los datos originales cambiando de hoja. El archivo está abajo, al lado del primero.

Esta entrada participa en la Edición 8.5 del Carnaval de Matemáticas cuyo anfitrión es, en esta ocasión, Santi García desde Raíz de 2.

PARA APRENDER MÁS:

La ley de Benford o el fenómeno del primer dígito: http://www.hezkuntza.ejgv.euskadi.eus/r43-573/es/contenidos/informacion/dia6_sigma/es_sigma/adjuntos/sigma_26/9_ley_benford.pdf
Ley de Benford: https://www.wikiwand.com/es/Ley_de_Benford
Web del Instituto nacional de estadística: http://www.ine.es/welcome.shtml
EXCEL con los datos usados en este post: https://www.dropbox.com/s/umoibmt488a256i/Ley%20N%C3%BAmeros%20An%C3%B3malos.xlsx?dl=0
Segundo archivo EXCEL con otros datos reales y datos generados por ordenador: https://www.dropbox.com/s/bsj3u4oqlcto78a/Ley%20N%C3%BAmeros%20An%C3%B3malos%202.xlsx?dl=0
One clap, two clap, three clap, forty?

By clapping more or less, you can signal to us which stories really stand out.