Os 5 erros comuns que levam a uma visualização de dados incorreta
A visualização de dados é uma ótima maneira de representar enormes quantidades de dados de forma simples e intuitiva. Todas as visualizações de dados têm o mesmo objetivo: ajudar os espectadores a entender facilmente as informações para fazer inferências ou decisões rápidas. É importante que as visualizações sejam certeiras, informativas, fáceis de navegar e não sejam exageradas.
Isso requer um pouco de aprendizado. Colocar uma boa visualização de dados não é apenas uma questão de jogar juntos alguns dados em gráficos coloridos. Visualizações desajeitadamente executadas tornam-se mais confusas do que úteis.
Aqui estão 5 erros comuns que levam a uma má visualização de dados. Evite isso para aproveitar ao máximo suas visualizações de dados.
1. Dados Errados
Existe um antigo princípio em ciência da computação: “Garbage In, Garbage Out”. No contexto da visualização de dados, isso significa que dados incorretos levará a visualizações incorretas. Comece com o básico: seus dados estão limpos? Antes de visualizar, use verificações em todas as etapas dos dados — coleta, limpeza e compilação. Erros comuns incluem duplicação de dados, dados perdidos, valores não numéricos não marcados, e assim por diante.
Por exemplo, neste gráfico de pizza, os três setores somam até 193%, o que não faz sentido. Esses erros nos dados tornam inúteis suas visualizações finais.
2. Escolha errada da visualização de dados
2 - Escolha errada da visualização de dados
3. Muita cor ou informação
Embora tenha sido estabelecido que o uso de cores diferentes ajuda as pessoas a interpretar as visualizações de dados mais rapidamente, muita cor pode confundir o visualizador. É importante escolher um número limitado de cores — 5 é um bom limite superior — que são distintos um do outro. Muitas cores, deixa a visualização abaixo seriamente bagunçada.
4. Notificação falsa de dados
O maior crime na visualização de dados é levar o espectador a uma interpretação errada. Por exemplo, este gráfico de barras parece mostrar que a porcentagem de mulheres abrangidas por um esquema de garantia de emprego mais do que duplicou de 2012–13 a 2016–17. No entanto, quando olhamos para o eixo y, vemos que ele começa de 48%, não 0%. Isto faz parecer que uma melhoria marginal de cerca de 5,5% parecer o dobro. Este é um erro que ocorre na maioria das vezes de forma proposital para enganar o leitor.
5. Escalas Inconsistentes
Você, naturalmente, pode representar múltiplas variáveis em uma única visualização de dados. No entanto, é sempre uma boa prática representá-los em uma única escala para evitar a confusão. Por exemplo, o gráfico abaixo mostra barras para os anos de 2010 a 2012 e, em seguida, divide o ano 2013 em barras de quatro trimestres. Isso pode ser confuso porque a escala do eixo x não foi mantida padrão.
Fonte: https://blog.socialcops.com/academy/resources/common-mistakes-bad-data-visualization/