La ley de los números anómalos: el teorema que no me creí hasta que lo comprobé.

@Pedrodanielpg
A todo Gauss
Published in
5 min readJul 22, 2018

Vivimos entre números, y muchos de ellos nos representan: el DNI, nuestro télefono, la matrícula del coche, la edad que tenemos, el mes en el que nacimos… vale, hasta aquí no os aporto nada nuevo, todo esto lo sabe cualquier persona que sepa balbucear, pero, ¿y si os dijera que entre todos esos números, que parecen dispuestos al azar… no lo están?

Now, let me to introduce… ¡La ley de Benford! Vamos al lío.

Esta ley tiene muchos nombres: ley de Benford, ley de los números anómalos, ley de los primeros números, ley del primer dígito… y además es una ley a la que tengo un cariño especial, ya que, la primera vez que la vi, pensé: “no puede ser cierto”… ¡y tuve que comprobarlo yo mismo! Vamos a ver qué significa todo esto:

Consideremos 9 dígitos:

1, 2, 3, 4, 5, 6, 7, 8, 9.

Vale, hasta aquí, todo bien. La probabilidad de elegir uno en concreto sería de un 11.11%, ya todos los números tienen la misma probabilidad de ser elegidos. No hemos considerarnos el cero porque vamos a quedarnos con el primer número de una secuencia de dígitos, y el primer número, nunca será el cero (escribiremos siempre números de la forma 293, no 0293).

Ahora, imagina que coges un libro al azar, lo abres por úna página al azar, y te fijas en un número. Bueno, no lo imagines, mejor hazlo: coge cualquier libro, revista, catálogo, artículo de internet o cualquier cosa que pueda leerse.

Yo acabo de hacerlo, y la primera combinación de números que he visto ha sido “29.95€”. Ahora nos quedamos con la primera cifra, es decir, con el 2.

Hasta aquí, podríamos pensar, como hemos dicho antes, que la probabilidad de que esa cifra fuera el 2 era de un 11.11%… ¡Pues no!

La ley de los números anómalos dice que la probabilidad de que el primer dígito sea el 1 es del 30%. ¿Cómo? ¡Es más del doble!

¡Pues hay más! Resulta que las probabilidades siguen una escala logarítmica, y son las siguientes:

1=30%, 2=17.6%, 3=12.5%, 4=9.7%, 5=7.9%, 6=6.7%, 7=5.8%, 8=5.1%, 9=4.6%

Vale… ¿De dónde ha salido todo esto? Y lo más importante, ¿Es verdad?

En 1881, el matemático Simon Newcomb se dió cuenta de que las primeras páginas de las tablas de logaritmos estaban más usadas que las últimas, y dedujo que los dígitos iniciales de secuencias aleatorias de números, no son equiprobables, es decir, algunos aparecen más que otros. Newcomb enunció la llamada ley logarítmica, que dice que: “la ley de probabilidad de la ocurrencia de números es tal que las mantisas de sus logaritmos son equiprobables”. Pero ahí se quedó, de forma verbal.

En 1938, el físico Frank Benford se dió cuenta de lo mismo al usar las tablas de logaritmos, y sin conocer las observaciones de Newcomb, se puso a investigarlo: recopiló un total de 20.229 números distintos. Los sacó de todos los datos que tenía a mano: constantes físicas y químicas, funciones matemáticas, la cantidad de lluvia que había caído cada mes en su ciudad, los números de domicilio de sus compañeros, algunos números que veía en las portadas de revistas, alturas de montañas, longitudes de ríos…, y a partir de los resultados, Benford postuló una “ley de los números anómalos” para la probabilidad de que el primer dígito sea d. Esta ley logarítmica se conoce como “ley de Benford”.

¿Sigues sin creerlo? ¡Yo tampoco!

Aquí es cuando me dije: “Pedro, tienes que comprobarlo”.

Así que fuí a la base de datos del Instituto de Nacional de Estadística de España (INE), y me descargue la base de datos más grande que encontré: el censo de población de todos los pueblos de España de 2016, dividido por sexos.

Pues ordené todos esos datos en un excel . Eran 16.254 números distintos, así que el resultado, debería salir similar al de Benford. Mediante la función “IZQUIERDA(CASILLA;1)”, me quedaba con el primero de los dígitos de cada uno de los datos, y luego, sumaba cuantas veces se repetía cada uno. Obtuve 3 resultados: Sólo hombres, sólo mujeres, y mixto. Adjunto el resultado para comparar con el de Benford, con precisión de 1 cifra decimal.

BENFORD (20229 datos):

1=30%, 2=17.6%, 3=12.5%, 4=9.7%, 5=7.9%, 6=6.7%, 7=5.8%, 8=5.1%, 9=4.6%

RESULTADO HOMBRES (8127 datos):

1=30.7%, 2=17.1%, 3=12.3%, 4=9.6%, 5=8.3%, 6=6.9%, 7=5.6%, 8=4.9%, 9=4.6%

RESULTADO MUJERES (8127 datos):

1=29.9%, 2=17.3%, 3=12.7%, 4=9.9%, 5=8.1%, 6=6.5%, 7=5.6%, 8=5.0%, 9=4.9%

RESULTADO TOTAL (16254 datos):

1=30.5%, 2=17.9%, 3=12.4%, 4=9.1%, 5=7.9%, 6=6.9%, 7=5.7%, 8=4.9%, 9=4.7%

Y aquí es cuando yo me quedé con la boca abierta. Funcionaba.

Como podeis ver, si comparamos resultados, los de Benford con el resultado total son prácticamente iguales. La diferencia no supera en ningún caso el 0.5%. Os dejo aquí el archivo en EXCEL con todos los datos para que podáis trastear con él y comparar todos los datos, tendréis el enlace al final.

Además, esta ley, que ya sí se ha estudiado bastante más, tiene algunas propiedades únicas. Por ejemplo, si cogemos todos los datos que teníamos antes y los multiplicamos por cualquier otro número (distinto de cero)… ¡La ley se sigue cumpliendo!

¿Y tú? ¿Qué te ha parecido la ley de los números anómalos? ¿Te animas a comprobar que se cumple en algún conjunto de datos?

EDIT: He añadido un segundo archivo EXCEL comparando los datos de poblaciones de 2016 e históricos de Cáceres, Badajoz, Extremadura e incluso datos al azar, para que veáis como funciona esta ley. Como siempre, se puede acceder a los datos originales cambiando de hoja. El archivo está abajo, al lado del primero.

Esta entrada participa en la Edición 8.5 del Carnaval de Matemáticas cuyo anfitrión es, en esta ocasión, Santi García desde Raíz de 2.

PARA APRENDER MÁS:

La ley de Benford o el fenómeno del primer dígito: http://www.hezkuntza.ejgv.euskadi.eus/r43-573/es/contenidos/informacion/dia6_sigma/es_sigma/adjuntos/sigma_26/9_ley_benford.pdf

Ley de Benford: https://www.wikiwand.com/es/Ley_de_Benford

Web del Instituto nacional de estadística: http://www.ine.es/welcome.shtml

EXCEL con los datos usados en este post: https://www.dropbox.com/s/umoibmt488a256i/Ley%20N%C3%BAmeros%20An%C3%B3malos.xlsx?dl=0

Segundo archivo EXCEL con otros datos reales y datos generados por ordenador: https://www.dropbox.com/s/bsj3u4oqlcto78a/Ley%20N%C3%BAmeros%20An%C3%B3malos%202.xlsx?dl=0

--

--

@Pedrodanielpg
A todo Gauss

Fiel defensor de que 0∉ℕ 📐 Matemático 👨🏽‍🏫 Profesor 👨🏽‍🚀 Divulgador ❓ Escéptico 📶 Miembro de @cienciascenio 📫 CONTACTO: atodogauss@gmail.com