Photo by Luke Chesser on Unsplash

10 consejos para crear mejores visualizaciones de datos

Cómo crear una visualización de datos linda pero también útil

Andrea Vargas
5 min readOct 30, 2020

--

Como científicxs o analistas de datos, una de las tareas fundamentales es visualizar resultados y consultas que se deriven de nuestros datos. Lo anterior puede ser con el objetivo de comunicar un resultado al público de interés o incluso para entender un aspecto de los datos que resulta más efectivo de hacer visualmente.

El valor de los datos está en su capacidad de contar una historia. Escoger las visualizaciones correctas nos permite descubrir esta historia y comunicar con mayor facilidad. Es por esto que las decisiones que tomemos cuando visualizamos nuestros datos son cruciales y pueden definir el destino de nuestra investigación o proyecto.

Este artículo presenta 10 consejos a tomar en cuenta cuando creamos visualizaciones de datos.

1. Determine el mensaje que quiere comunicar

El primer paso para construir un gráfico o visualización en general, debería ser, el porqué. Esto nos permite que la construcción sea más eficiente, ya que, al tener nuestro objetivo claro, las decisiones que tomemos en el camino resultan más fáciles de tomar.

Tenemos que recordar que no incluimos visualizaciones dentro de nuestros proyectos o informes solo porque sí o solo porque se ven bonitos, cada visualización que se incluya, debe tener un propósito bien definido y este debe demostrarse en el cuerpo del trabajo o en la exposición del mismo.

2. Más no es mejor

Cuando creamos un gráfico podemos vernos tentadxs a agregar muchos elementos, cuando, en la mayoría de casos, un gráfico simple comunica mejor que uno complejo, lleno de muchos colores, que incluye muchas variables, con elementos de texto, etc.

Algunos aspectos a tomar en cuenta con respecto a lo anterior son:

  1. Un gráfico debería comunicar solo un mensaje, no varios.
  2. Agregar elementos innecesarios confunde al lector
  3. Si no aporta información, probablemente no es necesario incluirlo

3. Determine qué tipo de datos va a visualizar

De la mano con el punto 1, el mensaje que queremos comunicar depende de los datos que tengamos para visualizar. Debemos entender qué tipo de variables tenemos a nuestra disposición, ¿es una variable numérica (compuesta por números) o categórica (contiene factores, categorías o niveles)?, si es una variable numérica, ¿es continua o discreta?, si es una variable categórica, ¿es binaria o de múltiples categorías? y si son dos o más variables interrelacionadas, debemos entender cuál es la relación que queremos probar entre estas, la cual, de nuevo, depende del tipo de variables a incorporar.

Una vez definido lo anterior, puede escoger el tipo de gráfico que mejor se acopla a sus necesidades. El tema de los gráficos adecuados para cada variable o combinación de estas se sale del objetivo de este artículo, aquí hay un par de guías que se pueden seguir al respecto:

4. La escala juega un papel importante

Los ejes del gráfico, los valores que se muestran son un elemento un tanto ignorado por muchos cuando se trata de “perfeccionar” un gráfico. Sin embargo, el papel que juegan puede ser esencial. Igual que en la mayoría de aspectos mencionados, aquí entra la necesidad a la que responde el gráfico para poder tomar decisiones.

No es lo mismo un gráfico con una escala en el eje “y” que va desde 0 a 100 y con saltos de 10 en 10, a uno con esa misma escala pero con saltos de 50 en 50. Aunque depende del caso específico, es recomendable que el eje no tenga saltos demasiados abruptos, con el objetivo de permitirle al lector poder identificar los valores aproximados o exactos de lo que muestra el gráfico.

Además, es recomendable empezar la escala siempre en “0” debido a que de lo contrario, la magnitud del comportamiento de los datos puede ser engañoso y parecer más drástico de lo que realmente es. Esto aplica sobre todo para gráficos de puntos o de tendencia.

5. No se olvide de las etiquetas

La etiqueta que se le asigna a estos ejes debe ser corta pero describir correctamente lo que representa. Lo anterior quiere decir que en muchos casos no podemos dejar la etiqueta que, por defecto, traen los gráficos que hacemos con algún paquete estadístico o lenguaje de programación ya que convencionalmente le pondrán el nombre de la variable, el cual muchas veces no representa exactamente lo que mostramos (por estar codificada o escrita de forma resumida).

6. El título debe ser claro

El título de su visualización debe mostrarle al lector qué es lo que estamos mostrando, esto implica, mencionar el qué, dónde, quién, cómo y cuándo si es necesario. Lo anterior se puede lograr con títulos largos o cortos, el tamaño no es realmente lo que debe preocuparnos, si no el mensaje que comunicamos.

Un consejo práctico para tomar en cuenta aquí es que el gráfico debe hablar por sí solo, no depender del resto del trabajo para entenderse y eso no se puede lograr sin un título que describa, de la forma más entendible posible, lo que estamos mostrando.

7. La interactividad puede incrementar el valor de su presentación

Los gráficos y mapas interactivos han incrementado su popularidad y con mucha razón, agregan un elemento de involucramiento entre el público y el mensaje. Herramientas extras como plotly tanto en R como Python, o herramientas incorporadas de Tableau y Power BI, permiten que el lector deje de ser solo eso y se involucre con nuestro trabajo, que investigue por su propia cuenta y pueda entender mejor lo que pretendíamos comunicar.

Se debe tomar en cuenta la forma de presentación final puesto que si se trata de un informe impreso o un documento estático como un “.docx”, la interactividad no podrá ser aprovechada. Caso contrario si generamos informes con formato pdf o html por ejemplo.

8. Use la leyenda a su favor, no en contra

La leyenda es un elemento de sumo valor, cuando se utiliza bien. Con esta podemos explicarle al lector lo que observa, ya sea, nombrando las categorías de una de las variables incluidas en el gráfico y su simbología o bien, mostrando el significado de la los colores de nuestra escala.

9. Explore utilizando gráficos

Los gráficos son una herramienta increíble para mostrar resultados, pero también pueden ser una herramienta intermedia que permite entender el comportamiento de nuestros datos y con esto, ayudarnos a guiar nuestra investigación. Durante los primeros pasos de su investigación, utilice visualizaciones para tratar de entender diferentes aspectos de sus datos, desde cantidad de valores faltantes, relaciones entre variables, comportamientos a lo largo del tiempo, cantidad de observaciones por categoría, entre muchos otros aspectos, pueden ser explorados gráficamente.

10. Tome en cuenta la población a la que va dirigido

No es lo mismo presentar un gráfico a una clase de adolescentes de colegio a presentarlo en un panel de cientificxs. La población a la que será presentado el gráfico o que pretendemos que lea nuestro artículo, debe guiar muchas de las decisiones que hagamos alrededor de la construcción de la visualización. Podemos hacernos algunas preguntas que nos ayuden a guiar este proceso: ¿qué les llama la atención? ¿Cómo puedo explicar estos aspectos de forma que me entiendan? ¿Cuál es el nivel de conocimiento sobre Estadística que manejan? ¿Qué tan controversial es lo que estoy mostrando para esa población?

En conclusión

Crear una visualización perfecta es una tarea casi imposible, pero tomando en cuenta los consejos que discutimos a lo largo de este artículo, podemos crear una que comunique lo que queremos que comunique, es decir, logramos que cumpla con su objetivo principal.

--

--