Contando uma história com dados: um exemplo prático sobre como melhorar os seus gráficos

Igor Duarte
Datapsico
Published in
5 min readJun 29, 2021

“Tell your story”, é essa a mensagem que aparece enquanto estou escrevendo esse artigo. Contar uma história pode ser aparentemente simples, mas… e se eu te pedisse para me contar uma história usando números, será que você conseguiria?

Essa é uma das principais demandas para o mundo atual que está cada vez mais inflado de dados e que precisa de pessoas que consigam transformá-los em uma boa história. Felizmente, aqui no Psicodata temos um artigo completo escrito pela Paula sobre fundamentos de Storytelling, uma área indispensável para quem quer trabalhar com dados.

Dashboard — (Pixabay)

Meu objetivo hoje, é mostrar para vocês alguns exemplos práticos sobre como melhorar as suas visualizações de dados e consequentemente melhorar a história que você pretende contar.

Sobre a base de dados…

No campo da saúde no Brasil é possível identificar muitas bases de dados disponibilizadas pelo Ministério da Saúde através do DATASUS sobre diversos campos, como por exemplo: Internações hospitalares, Informações ambulatoriais, dados sobre mortalidade etc. A tabulação desses dados pode ser realizada na web a partir do Tabnet (Você consegue ver como fazer isso no tutorial disponibilizado pelo próprio DATASUS aqui).

Para a criação desse artigo, utilizei a base de dados do DATASUS sobre internações hospitalares (SIH) e escolhi o Datawapprer como ferramenta para desenvolver as visualizações.

Tabnet — SIH/DATASUS

Supomos que vocês está desenvolvendo uma pesquisa sobre internações no Brasil e a pergunta inicial seja “Qual a Incidência de internações hospitalares relacionadas à Saúde Mental no Brasil por sexo de 2010 a 2020?” e precisa apresentar um gráfico que melhor represente isso. Como você faria?

Para esse fim, a ferramenta é considerada extremamente importante, mas não é a coisas mais importante no qual devemos nos preocupar, o mais importante é: Como mostrar um gráfico que represente a informação da maneira mais compreensível possível?

Visualizações ruins, decisões ruins…

Visualizações mal elaboradas podem atrapalhar o processo de análise. A demora em tentar compreender os dados dificulta a tomada de decisão em tempo ágil e acaba impactando de maneira negativa no resultado final.

Abaixo, um exemplo de gráfico gerado no Excel com os dados que representam a pergunta que estabelecemos anteriormente.

Gráfico com a quantidade anual de internações relacionadas à saúde mental no Brasil - Elaborado pelo autor

Aparentemente o gráfico apresenta as informações que precisamos, porém, demoraremos muito mais tempo para chegar a uma conclusão.

Como posso melhorar esse gráfico?

Analisando a base de dados identificamos que estamos lidando com uma série temporal que possui uma sazonalidade anual, por isso, o gráfico de linhas é uma visualização que traz melhores resultados para esse objetivo. É o que pode ser observado no exemplo abaixo.

Criado com datawrapper

O gráfico acima foi criado no Datawapprer, uma plataforma bem intuitiva e de fácil aprendizado, por lá é possível criar vários gráficos e mapas legais, vale a pena conferir!

Pontos importantes sobre as alterações realizadas

Como foi possível observar, a incidência foi maior nos últimos 10 anos para o sexo masculino. É importante inserir nas visualizações elementos textuais que indiquem eventos atípicos que podem ter causado alteração significativa na dispersão dos dados, nesse caso, a pandemia de COVID-19 pode ter sido um evento que explica a queda brusca no número de internações no ano de 2020.

Sobre as cores, decidi realçar com uma cor mais escura o valor que se sobressai, contribuindo para a absorção rápida da informação sem muito gasto cognitivo, além disso, os rótulos de dados inseridos apenas no primeiro e no último ponto contribui para uma visão mais limpa do gráfico, aproveitando bem o espaço em branco e reduzindo a saturação.

Outro exemplo…

Como estamos trabalhando com internações por causas do CID-10, iremos continuar fazendo gráficos acerca desse tema, por isso, o próximo exemplo irá responder a seguinte questão: Quais as diferenças em quantidade de internações por sexo e Causa do CID-10?

Para esses dados foi utilizado uma amostra de internações hospitalares de uma região específica do estado do Ceará e forma extraídos da mesma forma que os dados utilizados no exemplo anterior.

Abaixo, podemos perceber que estamos lidando com muita informação para um visual, por isso é importante identificar métodos para remover a saturação (o máximo possível).

Antes — Internações por sexo e capítulo do CID-10 (Elaborado pelo autor)

Percebam que mesmo lidando com muita informação é possível criar uma visualização mais bonita e simples de ser analisada. O gráfico abaixo é chamado de Dotplot, mostra as categorias em formato de pontos e o distanciamento entre elas.

Depois — Internações por sexo e capítulo do CID-10 (Elaborado pelo autor)

O processo de criação de uma visualização tem que estabelecer pelo menos dois objetivos: ser claro ou engajar aquele que está visualizando e isso pode ser observado nos dois exemplos citados acima.

No primeiro exemplo, observamos que a visualização era clara o suficiente para permitir uma análise rápida. No segundo gráfico, vimos que o tempo para analisar é relativamente maior do que no primeiro exemplo devido ao excesso de informações.

Além disso, a maneira como os dados estão plotados nos permite passar por ele de uma forma que não nos canse tanto, ou seja, nos engajando a buscar a resposta que precisamos.

Storytelling com dados pode ser muito desafiador e exige muito do nosso processo criativo, porém os resultados colhidos faz todo o esforço valer a pena.

Eu espero que esse artigo tenha sido útil e caso você alguma dúvida, sugestão ou esteja a fim de discutir sobre o tema, você pode falar comigo através do meu perfil no Linkedin, obrigado!

--

--

Igor Duarte
Datapsico

Psychologist, Master's student in psychiatry at the Federal University of Rio Grande do Sul