Moça, é sério, não beije este homem, ele ainda usa gráfico de pizza — Parte 2

Jão
Data Are Lakes
Published in
6 min readSep 27, 2020

Ainda estamos em 2020 e essa piada continua sem graça, mesmo com meu primeiro texto sobre o assunto, então se você quiser saber como a gente chegou aqui, confere lá a introdução.

Na primeira parte nos focamos em introduzir um pouco sobre a importância dos gráficos na construção do conhecimento e quais são os principais atributos a serem trabalhados na construção de um gráfico, nesta parte do texto que estamos agora vamos falar um pouco sobre o uso adequado dos gráficos de acordo com os dados que você deseja dispor e qual tipo de informação deseja passar.

O que são dados?

Como explicado no primeiro texto, dados são a unidade básica de informação, através da combinação de diferentes dados formamos estruturas mais complexas até chegar ao conhecimento sobre um determinado assunto.

Os dados, de maneira simplória, podem ser classificados como qualitativos ou quantitativos, sendo respectivamente, sobre uma qualidade (característica) de um dado ou sobre uma quantidade (intensidade) que um determinado dado representa. Ainda esses dados podem ser classificados como qualitativo ordinal ou nominal, quantitativo discreto ou contínuo. Esses são, por sua vez:

Qualitativo ordinal: Dados que podem ser dispostos em uma ordem de hierarquia como 1º, 2º, 3º e etc.

Qualitativo nominal: Estes representam o dado de maneira textual, funcionam literalmente como um indicador daquele dado, como por exemplo nome de cores, Azul, Vermelho, Rosa e etc.

Quantitativo discreto: São dados numéricos não decimais 1, 2, 3…

Quantitativo contínuo: Já esses, podem ser tomados como dados numéricos decimais, podendo também ser porcentagens, como 1.4%, 3.5%, 7.2% e assim por diante.

Mas afinal qual o problema do gráfico de pizza?

No livro “Storytelling com dados — Um guia sobre visualização de dados para profissionais de negócios” Cole Nussbaumer Knaflic fala sobre a ineficiência dos gráficos do tipo pizza em duas ocasiões, a primeira exemplificando a ineficiência visual dos gráficos de pizza e a segunda sobre as melhores alternativas a este tipo de gráfico.

Sobre a pouca eficiência visual dos gráficos do tipo pizza, não é uma exclusividade deles, gráficos de área e volume também são tão ineficientes quanto, na verdade, como vocês já perceberam, gráficos de pizza são gráficos de áreas circulares (¯\_(ツ)_/¯).

E isso se dá basicamente devido à complexidade da operação que você precisa fazer pra compreender. Essa ineficiência também pode ser dividida em dois problemas, distorção entre valores próximos e omissão de valores muito pequenos.

Quando seu cérebro encara um gráfico do tipo barra, basicamente você só precisa interpretar o comprimento daquela barra para entender, já gráficos de área, seu cérebro tende a comparar os tamanhos de áreas e quando elas são muito próximas, fica difícil de compreender. Visualmente, o que eu quero dizer é isso:

Gráfico de pizza e de barras sem rótulo de dados.

Na figura acima, temos a comparação de dois gráficos, com os mesmos valores, porém sem o auxílio do rótulo de dados não é fácil distinguir quais são os maiores e os menores no gráfico de pizza, mesmo quando eles estão em ordem, já no gráfico de colunas, facilmente você consegue distinguir a ordem de intensidade desses dados. Abaixo temos os mesmo gráficos da figura anterior com rótulos de dados e você consegue visualizar, bem melhor:

Gráfico de pizza e de barras com rótulo de dados.

Com uma variação pequena de valores entre os dados, é muito difícil de distinguir essa variação nos gráficos do tipo pizza. E se a variação é visualmente imperceptível, porque usar esse tipo de gráfico? Se a função do mesmo é auxiliar visualmente na compreensão da informação?

Não convenceu ainda? Vamos para o segundo motivo, gráficos de pizza são péssimos para representar muitas variáveis. Duvida? Dá uma olhada no gráfico abaixo.

Gráfico de pizza e de barras com rótulo de dados, para doze variáveis .

Os dados referentes as últimas três variáveis sequer são mencionados no gráfico de pizza, mas nesse caso você poderia resumir os dados que são muito pequenos, certo? Bem, você realmente poderia fazer isso, mas porque coletou doze variáveis se só utilizaria quatro ou cinco e resumiria as demais? São pontos a se refletir, quando estamos construindo representações visuais.

Gráficos de pizza são eficientes em um espaço de possibilidades muito restrito, quando você possui poucas variáveis (de preferência cinco ou menos) e quando a variação entre os valores das variáveis não muito pequenos. Em resumo, é um gráfico quase inútil, mas muito cômodo.

E aí fica o questionamento moça, se este homem não trata bem os dados que tem nas mãos vai saber dar o devido valor a seus beijos? Fica a reflexão.

Mas, como a vida não se resume a beijos, vamos para a última parte deste artigo, quando você que leu até aqui, moça, vai aprender qual o gráfico certo para os seus dados e ter um ótimo papo pra bater numa mesa de bar com um crush que sabe tratar bem seus dados.

Então o que meu crush precisa saber sobre dados?

Segue abaixo alguns exemplos de gráficos muito bons e utilizados recorrentemente que podem te ajudar a preparar representações visuais bem melhores do que utilizar gráfico de setores.

Gráfico de barras

Aplicação: Comparar a intensidade de diferentes categorias.

Indicado quando: Você tem um dado qualitativo nominal e um dado quantitativo. No gráfico abaixo, compara-se dados absolutos de vendas de diferentes produtos (dados fantasia).

Gráfico de barras comparando dados absolutos de venda de diferentes produtos (dados fantasia)

Gráfico de barras agrupadas

Aplicação: Comparar o desempenho de uma mesma variável para diferentes categorias.

Indicado quando: Você tem duas ou mais variáveis qualitativas e uma variável quantitativa. A seguir, o exemplo do gráfico de barras agrupadas é utilizado para comparar as quantidade absolutas de vendas de vários produtos para diferentes lojas (dados fantasia).

Gráfico de colunas agrupadas comparando dados absolutos de venda de diferentes produtos para diferentes lojas(dados fantasia)

Gráfico de barras empilhadas

Aplicação: Assim como o gráfico de barras agrupadas, serve para comparar valores de duas ou mais variáveis categóricas.

Indicado quando: Você precisa comparar valores relativos de vários dados qualitativos. É uma ótima alternativa ao gráfico de setores (pizza). Abaixo temos o exemplo do gráfico de barras empilhadas sendo utilizado para comparar dados percentuais de vendas de vários produtos para diferentes lojas (dados fantasia).

Gráfico de barras empilhadas comparando dados percentuais de  vendas de vários produtos para diferentes lojas(dados fantasia)

Histograma

Aplicação: Analisar a distribuição de uma determinada variável quantitativa. Histogramas são comumente confundidos com gráficos de barras, mas não são, apesar de possuir os mesmo atributos visuais de forma, os histogramas são ferramentas utilizadas para analisar a distribuição de uma variável.

Indicado quando: Você deseja analisar a frequência de uma determinada variável quantitativa, o histograma agrupa as variáveis de acordo com a frequência a mesma aparece. O exemplo exibe o agrupamento das potências de carros de acordo com a frequência que essas frequências aparecem (Dados fantasia).

Histograma de distribuição de potência (dados fantasia)

Gráfico de Dispersão

Aplicação: Comparar a correlação entre duas variáveis quantitativas.

Indicado quando: Você precisa analisar a interdependência entre dois tipos de dados, como no caso abaixo onde compara-se a velocidade final de carros, com a potência dos mesmos (Dados fantasia).

Exemplo de gráfico de dispersão comparando potência e velocidade máxima (dados fantasia)

Gráfico de Linhas

Aplicação: Assim como o gráfico de barras é indicado para comparar o desempenho de uma mesma variável para diferentes categorias.

Indicado quando: Você necessita exibir dados ao longo de uma série temporal, como no exemplo abaixo onde o total de vendas de diferentes lojas é comparado ao longo de um intervalo de 5 anos.

Gráfico de linhas comparando a venda anual para diferentes lojas (dados fantasia)

E vamos ficando por aqui com esse bate papo sobre gráficos e que esse preciosíssimo guia te ajude a construir representações visuais cada vez melhores e encontrar bons crushs também.

Espero, sinceramente que você que leu até aqui tenha gostado desse texto e saia com uma nova percepção sobre como tratar e exibir dados. Se esse texto te ajudou em alguma coisa, deixe suas palminhas, compartilhe com seus amigos e siga meu instagram.

--

--

Data Are Lakes
Data Are Lakes

Published in Data Are Lakes

Data Are Lakes é uma publicação voltada a falar sobre tópicos de visualização e gestão de dados numa abordagem mais descontraída e dialogando com o público que possui interesse pela área, mas ainda não possui conhecimento técnico.