Storytelling com dados: é tudo sobre highlights

Troopers Legacy
Troopers-Legacy
Published in
5 min readNov 30, 2023

Por Nayara Crispim

Você já leu sobre o tema storytelling com dados, viu exemplos de histórias bem contadas, mas tem dificuldade de associar as duas coisas?

Se sim, estamos juntos nessa! Visualização de dados é um tema de grande importância na análise de dados e contar histórias por meio dos dados pode facilitar a compreensão de quem lê. Por outro lado, pode ser difícil conectar números a representações quanti ou qualitativas de forma a criar uma narrativa de fácil entendimento e que realmente passa a mensagem que queremos.

Refletindo sobre isso, percebi que um certo recurso pode ajudar: no fim, é tudo sobre highlights. Highlight é mais um termo do inglês que trouxemos para o nosso vocabulário e que significa “destaque”. O que quero dizer, então, é que tudo depende das informações que você escolhe ressaltar e dos recursos que você utiliza para tal. Ou seja, fica mais fácil construir uma narrativa conectando tudo se você tem elementos que facilitam essa conexão, como dados já destacados.

Como acredito muito no aprendizado na prática, principalmente quando se trata deste tipo de conteúdo, vou trazer exemplos de visualizações de dados na versão antes x depois. São exemplos totalmente fictícios e números da seguinte fonte: vozes da minha cabeça (rs).

Exemplo 1

Contexto: total de ingressantes na graduação por ano — 2018 a 2022 — segmentado por estado civil; dados em percentual do total.

História a ser contada: o percentual de divorciados ingressando na graduação cresceu ao longo destes 5 anos.

Opção A:

Quando usamos cor + legenda dessa forma, tudo está em destaque e, no fim das contas, nada é destacado.

Opção B:

É comum pensarmos em inverter eixo e legenda, porque séries temporais geralmente se encaixam melhor no eixo X. Entretanto, aqui também é difícil contar a história que queremos.

Opção C:

Nesse caso, sim, podemos contar a história desejada utilizando o gráfico, porque a conexão entre a informação “O percentual de divorciados ingressando na graduação cresceu ao longo destes 5 anos.” e o mostrado no gráfico é feita quase instantaneamente.

Exemplo 2

Contexto: retenção de usuários assinantes de um produto por número de meses após a assinatura.

História a ser contada: os assinantes dos meses de março e abril tiveram menor retenção, que ficou abaixo de 80% já no 1º semestre.

Opção A:

Neste exemplo, já existe uma complexidade por dois motivos: 1) tabelas trazem muita informação e pode ser difícil lê-las e 2) temos um gráfico de cohort, que precisa de uma boa análise para ser compreendido.

Uma vez entendido que as linhas representam o mês da assinatura e as colunas, o número de meses após a efetivação, o destaque tem o papel de ressaltar a informação desejada. No caso de uma formatação em gradiente, está tudo em destaque, então ainda que o contraste entre as cores verde e vermelho transmitam a mensagem de redução ao longo do tempo, a forma como está distribuído não evidencia a queda dos meses de março e abril.

Opção B:

Dessa forma, está claro que os meses de março e abril atingiram valores de retenção menores que 80% antes dos demais, que tiveram valores > 80% pelo menos nos 6 primeiros meses. Lembrando que a história é: “Os assinantes dos meses de março e abril tiveram menor retenção, que ficou abaixo de 80% já no 1º semestre.”

Exemplo 3

Contexto: nota média por ano — 2015 a 2023 — segmentada por disciplina — Matemática, Português e Ciências.

História a ser contada: a nota média das 3 disciplinas apresentou queda significativa devido à pandemia de Covid-19.

Opção A:

A falta de destaque ao longo dos anos impede a fácil visualização da queda entre os anos de 2019 e 2020. Além disso, as linhas que se cruzam não são elementos que favorecem um bom highlight.

Opção B:

Este foi um bom exemplo de que limitações da ferramenta não justificam dados não destacados. O ideal seria destacar não somente os marcadores dos anos de interesse, mas também a linha que os une, na mesma cor laranja. A ferramenta utilizada nesse caso — Power BI — não permite essa personalização. Ainda assim, é possível encontrar alternativas para se destacar o intervalo. Dessa forma, a informação “A nota média das 3 disciplinas — Ciências, Matemática e Português — apresentou queda significativa devido à pandemia de Covid-19, entre os anos de 2019 e 2020.” pode ser facilmente validada no gráfico.

As diferentes ferramentas de visualização de dados podem ter recursos mais ou menos avançados para a formatação dos visuais, mas independente disso, saber boas práticas para destacar o necessário é mais importante do que a ferramenta utilizada.

O fluxo ideal é:

Por fim, um resumo dos pontos principais a serem considerados para um bom dataviz:

  1. Destacar informações demais não destaca nada, então: destaque somente o necessário — o que valida a história que está contando.
  2. Se por um lado, inserir elementos é importante (como os destaques), retirar pode ser ainda mais: retire todos os elementos que são desnecessários para o entendimento da informação (eixo que pode virar rótulo de dados, título do eixo que já foi mencionado no título geral, linhas de grade e etc).
  3. Teste e analise diferentes tipos de gráficos e agrupamentos para encontrar o que melhor conta sua história.
  4. Utilize cores com moderação; elas são um ótimo recurso para criar destaque, mas também podem gerar um visual com informação demais.

Experimente seguir esse caminho, colocando em prática sua criatividade e testando diferentes possibilidades, e a tarefa de contar histórias por meio dos dados se tornará mais fácil e eficiente!

--

--

Troopers Legacy
Troopers-Legacy

Experiências construídas com autonomia (de verdade), liberdade e muito amor, que vão inspirar a sua carreira.