Pensar como un estadístico, pero sin la matemática.

Traducción de “Think Like a Statistician — Without the Math” de Nathan Yau

*Photo by misterbisson

Me considero un estadístico, porque, bueno, tengo un título en Estadística. Sin embargo, si me preguntas específicamente sobre formular una hipótesis o el tamaño requerido para un muestreo seguramente mi respuesta no sea muy buena.

Hace unos días intentaba recordar la última vez que efectivamente realicé una hipótesis o un análisis formal. No pude. Tuve que recurrir a viejos apuntes para recordar como se hacía. Fue hace cuatro años cuando cursaba mi primer año en la facultad. Me iba bien en esos cursos, y confío en que podría hacerlo con un pequeño repaso, pero es un no de entrada. No es algo que hago regularmente.

En lugar de eso, las cosas más importantes que he aprendido son menos formales, pero han probado ser muy útiles a la hora de trabajar/jugar con los datos. Aquí se las presento sin ningún orden en particular.

Atención al detalle

A menudo son las pequeñas cosas las que terminan siendo las más importantes. En cierta ocasión un profesor proyectó cierto gráfico en el que se veían un montón de puntos con una fina línea y nos preguntó que veíamos. Bien, se observaba un incremente al comienzo, estabilizándose a la mitad, y luego otro incremente. Sin embargo, lo que me perdí fue la pequeña mancha en la curva en el primer aumento. Eso era lo que estábamos buscando.

El punto es que las tendencias y los patrones son importantes, pero también lo son las partes aisladas, los puntos perdidos y las inconsistencias.

Ver el panorama completo

Con lo dicho, es importante no dejarse atrapar con los datos individuales o una pequeña sección de una gran base de datos. En la reciente publicación de un gráfico por la administración de Obama, usuarios señalaron que si tomábamos un paso hacia atrás para abarcar un mayor lapso de tiempo, el contraste entre Obama y Bush no era tan chocante.

Sin Agendas.

Esto no debería decirlo, pero intenten acercarse a los datos de la manera más objetiva posible. No estoy diciendo que no tengan una idea preconcebida sobre lo que están buscando, pero no dejen que estas influencien los resultados que obtengan. Si buscan durante un tiempo prolongado un tipo de patrón específico, seguramente terminen encontrándolo y será a costa de resultados acertados.

Ver por fuera de los datos.

Contexto, contexto, contexto. A veces aparece en forma de meta datos. En ocasiones vendrá en forma de más datos.

Mientras más conozcas los datos que has recolectado, de dónde provienen, cuándo ocurrió y qué sucedía en ese momento histórico, más informativos serán los resultados y podrás estar más confiado de los resultados obtenidos.

Preguntarse: ¿Por qué?

Finalmente, y esto es lo más importante que he aprendido, siempre pregunta el porqué. Cuando veas un punto en un gráfico, deberías preguntarte por qué está ahí. Si encontrás una correlación, deberías asegurarte si tiene o no sentido. Si no tiene sentido, genial! Pero de lo contrario, deberías investigar aún más.

Los números son grandiosos, pero deberías recordar que cuando los humanos nos involucramos, los errores son una posibilidad.