Os 5 erros comuns que levam a uma visualização de dados incorreta

ELIEZER BOURCHARDT
3 min readOct 13, 2017

A visualização de dados é uma ótima maneira de representar enormes quantidades de dados de forma simples e intuitiva. Todas as visualizações de dados têm o mesmo objetivo: ajudar os espectadores a entender facilmente as informações para fazer inferências ou decisões rápidas. É importante que as visualizações sejam certeiras, informativas, fáceis de navegar e não sejam exageradas.

Isso requer um pouco de aprendizado. Colocar uma boa visualização de dados não é apenas uma questão de jogar juntos alguns dados em gráficos coloridos. Visualizações desajeitadamente executadas tornam-se mais confusas do que úteis.

Aqui estão 5 erros comuns que levam a uma má visualização de dados. Evite isso para aproveitar ao máximo suas visualizações de dados.

1. Dados Errados

Existe um antigo princípio em ciência da computação: “Garbage In, Garbage Out”. No contexto da visualização de dados, isso significa que dados incorretos levará a visualizações incorretas. Comece com o básico: seus dados estão limpos? Antes de visualizar, use verificações em todas as etapas dos dados — coleta, limpeza e compilação. Erros comuns incluem duplicação de dados, dados perdidos, valores não numéricos não marcados, e assim por diante.

Por exemplo, neste gráfico de pizza, os três setores somam até 193%, o que não faz sentido. Esses erros nos dados tornam inúteis suas visualizações finais.

2. Escolha errada da visualização de dados

2 - Escolha errada da visualização de dados

3. Muita cor ou informação

Embora tenha sido estabelecido que o uso de cores diferentes ajuda as pessoas a interpretar as visualizações de dados mais rapidamente, muita cor pode confundir o visualizador. É importante escolher um número limitado de cores — 5 é um bom limite superior — que são distintos um do outro. Muitas cores, deixa a visualização abaixo seriamente bagunçada.

4. Notificação falsa de dados

O maior crime na visualização de dados é levar o espectador a uma interpretação errada. Por exemplo, este gráfico de barras parece mostrar que a porcentagem de mulheres abrangidas por um esquema de garantia de emprego mais do que duplicou de 2012–13 a 2016–17. No entanto, quando olhamos para o eixo y, vemos que ele começa de 48%, não 0%. Isto faz parecer que uma melhoria marginal de cerca de 5,5% parecer o dobro. Este é um erro que ocorre na maioria das vezes de forma proposital para enganar o leitor.

5. Escalas Inconsistentes

Você, naturalmente, pode representar múltiplas variáveis em uma única visualização de dados. No entanto, é sempre uma boa prática representá-los em uma única escala para evitar a confusão. Por exemplo, o gráfico abaixo mostra barras para os anos de 2010 a 2012 e, em seguida, divide o ano 2013 em barras de quatro trimestres. Isso pode ser confuso porque a escala do eixo x não foi mantida padrão.

Fonte: https://blog.socialcops.com/academy/resources/common-mistakes-bad-data-visualization/

--

--

ELIEZER BOURCHARDT

Bacharel em Sistemas de Informação, programador e cientista de dados.