Contando uma história com dados: um exemplo prático sobre como melhorar os seus gráficos
“Tell your story”, é essa a mensagem que aparece enquanto estou escrevendo esse artigo. Contar uma história pode ser aparentemente simples, mas… e se eu te pedisse para me contar uma história usando números, será que você conseguiria?
Essa é uma das principais demandas para o mundo atual que está cada vez mais inflado de dados e que precisa de pessoas que consigam transformá-los em uma boa história. Felizmente, aqui no Psicodata temos um artigo completo escrito pela Paula sobre fundamentos de Storytelling, uma área indispensável para quem quer trabalhar com dados.
Meu objetivo hoje, é mostrar para vocês alguns exemplos práticos sobre como melhorar as suas visualizações de dados e consequentemente melhorar a história que você pretende contar.
Sobre a base de dados…
No campo da saúde no Brasil é possível identificar muitas bases de dados disponibilizadas pelo Ministério da Saúde através do DATASUS sobre diversos campos, como por exemplo: Internações hospitalares, Informações ambulatoriais, dados sobre mortalidade etc. A tabulação desses dados pode ser realizada na web a partir do Tabnet (Você consegue ver como fazer isso no tutorial disponibilizado pelo próprio DATASUS aqui).
Para a criação desse artigo, utilizei a base de dados do DATASUS sobre internações hospitalares (SIH) e escolhi o Datawapprer como ferramenta para desenvolver as visualizações.
Supomos que vocês está desenvolvendo uma pesquisa sobre internações no Brasil e a pergunta inicial seja “Qual a Incidência de internações hospitalares relacionadas à Saúde Mental no Brasil por sexo de 2010 a 2020?” e precisa apresentar um gráfico que melhor represente isso. Como você faria?
Para esse fim, a ferramenta é considerada extremamente importante, mas não é a coisas mais importante no qual devemos nos preocupar, o mais importante é: Como mostrar um gráfico que represente a informação da maneira mais compreensível possível?
Visualizações ruins, decisões ruins…
Visualizações mal elaboradas podem atrapalhar o processo de análise. A demora em tentar compreender os dados dificulta a tomada de decisão em tempo ágil e acaba impactando de maneira negativa no resultado final.
Abaixo, um exemplo de gráfico gerado no Excel com os dados que representam a pergunta que estabelecemos anteriormente.
Aparentemente o gráfico apresenta as informações que precisamos, porém, demoraremos muito mais tempo para chegar a uma conclusão.
Como posso melhorar esse gráfico?
Analisando a base de dados identificamos que estamos lidando com uma série temporal que possui uma sazonalidade anual, por isso, o gráfico de linhas é uma visualização que traz melhores resultados para esse objetivo. É o que pode ser observado no exemplo abaixo.
O gráfico acima foi criado no Datawapprer, uma plataforma bem intuitiva e de fácil aprendizado, por lá é possível criar vários gráficos e mapas legais, vale a pena conferir!
Pontos importantes sobre as alterações realizadas
Como foi possível observar, a incidência foi maior nos últimos 10 anos para o sexo masculino. É importante inserir nas visualizações elementos textuais que indiquem eventos atípicos que podem ter causado alteração significativa na dispersão dos dados, nesse caso, a pandemia de COVID-19 pode ter sido um evento que explica a queda brusca no número de internações no ano de 2020.
Sobre as cores, decidi realçar com uma cor mais escura o valor que se sobressai, contribuindo para a absorção rápida da informação sem muito gasto cognitivo, além disso, os rótulos de dados inseridos apenas no primeiro e no último ponto contribui para uma visão mais limpa do gráfico, aproveitando bem o espaço em branco e reduzindo a saturação.
Outro exemplo…
Como estamos trabalhando com internações por causas do CID-10, iremos continuar fazendo gráficos acerca desse tema, por isso, o próximo exemplo irá responder a seguinte questão: Quais as diferenças em quantidade de internações por sexo e Causa do CID-10?
Para esses dados foi utilizado uma amostra de internações hospitalares de uma região específica do estado do Ceará e forma extraídos da mesma forma que os dados utilizados no exemplo anterior.
Abaixo, podemos perceber que estamos lidando com muita informação para um visual, por isso é importante identificar métodos para remover a saturação (o máximo possível).
Percebam que mesmo lidando com muita informação é possível criar uma visualização mais bonita e simples de ser analisada. O gráfico abaixo é chamado de Dotplot, mostra as categorias em formato de pontos e o distanciamento entre elas.
O processo de criação de uma visualização tem que estabelecer pelo menos dois objetivos: ser claro ou engajar aquele que está visualizando e isso pode ser observado nos dois exemplos citados acima.
No primeiro exemplo, observamos que a visualização era clara o suficiente para permitir uma análise rápida. No segundo gráfico, vimos que o tempo para analisar é relativamente maior do que no primeiro exemplo devido ao excesso de informações.
Além disso, a maneira como os dados estão plotados nos permite passar por ele de uma forma que não nos canse tanto, ou seja, nos engajando a buscar a resposta que precisamos.
Storytelling com dados pode ser muito desafiador e exige muito do nosso processo criativo, porém os resultados colhidos faz todo o esforço valer a pena.
Eu espero que esse artigo tenha sido útil e caso você alguma dúvida, sugestão ou esteja a fim de discutir sobre o tema, você pode falar comigo através do meu perfil no Linkedin, obrigado!