Cinco errores que tu empresa no debe cometer en la visualización de datos

Franco Vielma
qu4nt
Published in
6 min readJan 27, 2019
Imagen referencial desde Schollofdata

Reconociendo el valor estratégico de la información, las empresas suelen manejar un volumen de datos que en muchos casos, son procesados y presentados inadecuadamente.

¿Culpa del contador? ¿Culpa del diseñador? ¿Del computista o informático? Culpa del nivel estratégico de la organización en realidad, precisamente por no monitorear, adecuar y renovar su sistema de gestión de información.

Los errores pueden ser garrafales, algunos con consecuencias muy negativas para las empresas pudiendo ser en algunos casos una vergüenza pública.

A continuación algunos ejemplos:

“Objects in mirror are BIGGER than they appear?”

El sitio Schoolofdata ofrece un ejemplo claro de cómo la cuestión de perspectiva puede ser presentada mediante los gráficos y como éstos pueden distorsionar la percepción sobre la información que se presenta.

Dale un vistazo a los dos diagramas a continuación:

Cortesía de Schoolofdata

Imagina el encabezado de ambas gráficas. El de la izquierda se podría llamar “El gasto en Salud Pública en Finlandia incrementa“, pero la gráfica de la derecha se podría llamar “El gasto en salud pública en Finlandia se mantiene estable”. Como podemos observar las dos gráficas son iguales y las dos son incorrectas.

En la gráfica de la izquierda, los datos no empiezan en cero; comienzan en $3000. Esto hace que los datos parezcan mucho más grandes. Por ejemplo: los gastos del 2001–2002 al parecer se triplicaron, pero no es el caso. Más bien es cuestión de perspectiva.

La gráfica de la derecha empieza con $0, pero tiene un rango de 30,000. Los datos sólo llegan hasta $9000. Esto es más preciso que la gráfica de la izquierda, pero es confuso.

Desproporciones que inducen manipulación

En estadística y visualización de datos, la exageración supone un absurdo que no demora mucho en ser descubierto. Para una empresa, hacer ver más grande algo que no es tan grande, supone un riesgo muy alto que puede ocurrir por error, o de manera deliberada.

En la gráfica que presentamos a continuación hay un ejemplo claro. Intenta mostrar el número de espectadores en dos canales de televisión de España. Como podemos observar una diferencia de apenas dos décimas se convierte en la gráfica en varios puntos de diferencia.

Cortesía de javimaticas.wordpress

Representar de forma distorsionada la información para manipular a la audiencia, deja pocas dudas sobre su intención: fue realizada por el mismo canal y quizás no toda su audiencia pudo observar el error, dando como cierta tal manipulación.

Los ejemplos pueden llegar a ser más vergonzosos. Una visualización no apropiada de datos, puede conllevar a su falta de credibilidad. Cuando se trata de información de carácter serio y relevante y está puede verse seriamente distorsionada en gráficos.

Un ejemplo tuvo lugar en el año 2010, justo en el cenit de la crisis económica de España que inició en 2008. El canal TVE propiedad del Estado español, publicó una gráfica del desempleo en ese país comparándolo con el de la Eurozona (países donde la moneda es el Euro) y la unión Europea (países integrados al ente multilateral pero que tienen moneda propia, como Gran Bretaña antes del brexit). Con ello maquillaron la gestión del gobierno español del momento.

Desde javimaticas.wordpress

En este caso la desproporción fue a pequeño y es sumamente penosa.

“Dicen que el tiempo cura todo…”

Las líneas del tiempo también son elementales para los mostrar datos. Mira el esquema a continuación sobre el tema de la salud en Finlandia.

¿Existe un claro incremento de los gastos en salud pública desde el 2002? No. Fijémonos en que, antes de 2004, la gráfica se representa de forma anual. Pero existe un salto de 3 años del 2004 al 2007, y de dos años del 2007 al 2009. Esta gráfica nos hace creer que, desde 2002, los gastos en salud pública crecieron a partir de ese año, pero no es así. Al trabajar con líneas de tiempo, en este caso no se aseguraron que las escalas o lapsos de tiempo fueran iguales.

Errores en los datos

Los gráficos son a imagen y semejanza de la información que se utiliza para generarlos. La imagen a continuación es sobre un insólito caso en la disputa del Partido Republicano de Estados Unidos, para definir su candidatura presidencial en el año 2011. En ella, Mitt Romney, Sarah Palin y Mike Huckabee apareciaron en un extraño grafico nada más y nada menos que en la cadena estadounidense FOX, de línea conservadora.

Imagen desde sao14598.blogspot

En esta gráfica podemos apreciar que los porcentajes dan un total de 193%, a pesar de que se está utilizando una gráfica que implica demostrar las divisiones de un 100%.

Por cierto, no debe sorprendernos que la cadena FOX haya estado tan mal ese año, entendiendo que la política estadounidense también estuvo bastante mal. En esas elecciones primarias republicanas ganó Mitt Romney y Sarah Palin llegó de segundo lugar, pero Palin venía de ser gobernadora de Alaska y fue candidata a la Vicepresidencia en formula junto a John Mc´cain. Palin, cristiana conservadora, fusionó las teorías de la evolución y la creación afirmando que los dinosaurios eran criaturas del Edén.

Las gráficas ininteligibles

En teoría, la visualización de la información a través de gráficos, implica la simplificación de los datos para su procesamiento y presentación. No siempre ocurre así. Veamos.

Desde sao14598.blogspot

En la parte izquierda hay un diagrama poco congruente, mal presentado, poco entendible como líneas por su presentación en una parte reducida de la imagen. La gráfica de la derecha no tiene mucho sentido, por ejemplo la barra correspondiente al 2005 que es la que tiene el menor porcentaje, es bastante más grande que las otras, de hecho, la más pequeña es la que tiene el porcentaje mas alto y a su vez, es del mismo tamaño que otra con sólo 18.7%.

¿Como abordar estos problemas?

No se trata de un problema exclusivo de la herramienta utilizada. La solución no pasa por un manejo más adecuado de las hojas de cálculo. Los errores de forma en la presentación de la información, en esencia no son sólo problemas de forma. Son problemas de fondo. Dan cuenta de que los procesos de gestión de datos son sensibles y altamente pertinentes no sólo para la presentación, sino para el desarrollo de la gestión en un marco de integralidad, atravesado por la toma de decisiones, los contextos estratégicos de la empresa y el sentido de oportunidad.

Dicho de otra forma, la ciencia de datos resuelve estos dilemas mediante el estudio de los fenómenos y los procesos de gestión, desde el rigor y la pertinencia.

Les invito a revisar este trabajo introductorio sobre visualización con Python. Pues en el marco de la ciencia de datos, debemos interesarnos obviamente en la visualización dela información y del conocimiento e indagar en sus adentros el proceso que lo hace posible, en el presente y de cara al futuro.

--

--

Franco Vielma
qu4nt
Writer for

Sociólogo, analista y escritor. Sociedad, economía, sociedad de la información, comunicación, procesos socioculturales.