Qual história seus dados contam? Visualização de Dados e Data Storytelling

Perfeito! Análises prontas. Encontramos resultados incríveis! Mas… e agora?

Paula Costa
Datapsico
6 min readNov 20, 2020

--

Agora, queremos comunicar isso para todo mundo. Mas nem todo mundo sabe (ou gosta) de ciência de dados… Aí entra a visualização. Mas o que é “visualização de dados”?

Visualização de dados é a habilidade de apresentar suas análises visualmente, seja dentro da sua equipe de data science ou para outras pessoas. A partir dela, você pode comunicar aquilo que está vendo nos dados.

Essa é uma definição minha, baseada no que eu já vivi analisando dados. Seja na universidade ou no meio corporativo, é necessário apresentar suas análises claramente para que elas sejam não só entendidas como também reconhecidas e validadas. A visualização de dados pode ser usada durante as análises para gerar insights, mas vou focar na sua utilização quando apresentamos nossos dados para outras pessoas.

Vou apresentar aqui 3 pontos que, na minha experiência, são importantíssimos na apresentação das suas análises para alguém, seja na universidade, no trabalho ou no grupo de pesquisa.

Quem é o seu público?

Você está apresentando seus dados em um artigo científico, numa banca de TCC ou na sua defesa de mestrado? Ou está em uma reunião administrativa na sua empresa? Ou, quem sabe, está elaborando um relatório que será divulgado para uma instituição inteira? São situações bem diferentes e cada uma apresenta um público com desafios distintos.

Apresentando suas análises no meio acadêmico, você provavelmente estará falando com doutores e pessoas que já sabem bastante sobre metodologia científica e testes estatísticos. Nesse caso, é ótimo que você traga os índices das análises detalhadamente e gráficos mais complexos poderão ser mostrados sem grandes explicações. Obviamente, esse público demanda de você um domínio mais aprofundado da técnica e da teoria, mas, se preparando bem, é bem provável que suas análises sejam entendidas.

Porém, por vezes, esse não era o meu caso. Tive que apresentar minhas análises para funcionários da empresa, que não possuíam intimidade com termos estatísticos ou com metodologia de pesquisa. Logo, minhas análises, por mais refinadas que fossem, não teriam impacto se eu as apresentasse de forma técnica, com termos desconhecidos. A magia estava em devolver o conhecimento de um jeito que fizesse sentido para o meu público, não só para mim. E aí entra a visualização de dados e o data storytelling.

Para esses públicos, eu tenho que me adaptar e eu gosto de fazer isso contando a história desses dados, o que chamamos de “data storytelling”. No data storytelling, eu consigo envolver o meu público e mostrar análises com significado, que se conectam com o dia a dia deles. Faço isso dando o contexto do momento da pesquisa, trazendo mitos que rolavam pelo “rádio corredor” e que apareceram (ou foram questionados) na pesquisa, exemplificando como aqueles achados se dão no dia a dia ou até trazendo dados mais qualitativos.

É mais fácil chover no molhado, explicar para quem já entende. Mas se não conseguimos comunicar para o outro aquilo que encontramos nos dados, insights não passam de insights.

Conseguir “traduzir” os dados para outras pessoas é uma habilidade importantíssima para um pesquisador (mesmo que muitas vezes ela seja subestimada), pois dá potência para nossas análises produzirem transformação. Hoje em dia, existem até mesmo alguns profissionais que se intitulam como data translators, que fazem o meio de campo entre a área técnica e área de business intelligence das empresas. Isso porque é necessário que profissionais de fora da ciência de dados entendam o que as análises estão dizendo. Para empresas que focam na cultura de data driven, cada vez mais essa habilidade de tradução se faz crucial. Consequentemente, a visualização de dados e data storytelling possuem papel fundamental nessas ocasiões.

Como apresentar meus dados?

Aqui está o cerne da questão. O que você apresentará? Às vezes, temos 15 minutos para apresentar análises que duraram semanas ou meses para serem feitas. Então temos que ser estratégicos. Quais informações são mais interessantes (e válidas) para a demanda do meu público? Quais gráficos são mais explicativos para meu problema de pesquisa?

Estudando visualização, aprendi que diferentes tipos de gráficos se propõem a diferentes objetivos. Um gráfico de linhas funciona melhor quando queremos dar a sensação de continuidade, como no comportamento de uma variável ao longo do tempo. Mostrando um pouco mais de informação, um gráfico de barras com porcentagem embutida pode ser uma boa.

Suas escolhas vão depender do que você quer comunicar. Quando vou realizar uma apresentação, eu testo os mesmos dados em vários tipos de gráficos, pensando no data storytelling que estou construindo com a apresentação. Isso faz com que eu perceba outras formas de comunicar aqueles achados e avaliar qual delas se encaixa melhor.

Além disso, quando estamos absorvidos nos dados, podemos pensar que alguns pontos são óbvios, quando na verdade não são. Por isso, considero uma boa prática pedir a opinião de alguém que não é da área para avaliar o quão claros estamos sendo.

Um clichê importante: menos é mais. Pensando no seu público, um gráfico atolado de informações não é uma boa estratégia de apresentação. Isso aumenta as chances do seu público ficar confuso (e até assustado) com suas análises. Precisamos mostrar com clareza os dados, mesmo que isso signifique não entrar profundamente em índices e teoria estatística. Aí vai uma frase que tenho aprendido nos últimos meses:

É possível ser simples sem ser superficial.

Eu sei que a vontade é mostrar todas as informações possíveis da nossa pesquisa, pois deu trabalho realizá-la. Parece que tudo é importante e eu também tenho receio de simplificar demais as explicações nessas apresentações expressas. Mas precisamos elencar as prioridades do que comunicar e há formas de ser objetivo sem perder a complexidade da pesquisa. Para que a nossa apresentação seja clara e eficiente precisamos ter objetividade com estratégia. E sempre é possível deixar slides com informações e gráficos adicionais ocultos na apresentação ou no final dela. Assim, caso surjam dúvidas (ou sobre um tempinho para você mostrá-las hehehe), estará preparado(a).

Quais ferramentas utilizar?

Na minha rede de cientistas de dados, já percebi que existem algumas ferramentas que são as queridinhas da galera: Power BI e Tableau são muito usadas pelas empresas para visualização. Em opções mais populares, temos o Excel. Concordo que não seja um software super potente, mas considero ele acessível e pode auxiliar muito quando bem utilizado. O meu favorito com certeza é o R (inclusive temos outros artigos sobre ele aqui no PsicoData), porque ele apresenta uma infinidade de possibilidades de gráficos bem informativos e claros, e clareza é fundamental na visualização de dados.

Tenha em mente que o seu gráfico precisa falar sozinho. Quando é necessário explicar muito para entender o gráfico, ele não serviu ao seu propósito, que é justamente tornar a explicação dos dados intuitiva e fluida.

Photo by Luke Chesser on Unsplash

Poderia falar aqui sobre scatter plot, line charts, tree map, spatial charts, survey plot e tantos outros assuntos dentro de visualização. Mas considero que esse seja um percurso de cada cientista de dados, com sua questão de pesquisa. Independente da ferramenta e do tipo de visualização, é necessário que seu gráfico seja autoexplicativo, porque ele é um recurso que deve falar por você e/ou te ajudar a mostrar o que há de importante nos dados.

Considerando as dores e desejos do seu público e pensando no seu data storytelling, acredito que tenha um bom começo para apresentar suas análises de um jeito que faça sentido para você e para quem está ouvindo.

Resumindo, tenha em mente: 1. Quem é seu público; 2. Quais dados apresentar e como; 3. Quais ferramentas podem te ajudar.

Particularmente, esse momento de comunicar para as pessoas nossos resultados é uma das mais bonitas de toda a pesquisa. A sabedoria vem das pessoas, pelos dados delas, de forma caótica. O cientista de dados sistematiza e transforma isso em conhecimento, para então devolver aos primeiros donos. Precisamos de profissionais ótimos na técnica, mas também precisamos de comunicadores de insights. O que você é?

Photo by Ryoji Iwata on Unsplash

--

--

Paula Costa
Datapsico

Estudante de Psicologia, apaixonada por dados&gente. Textos com início, algum meio e sem fim, pois as dúvidas não cessam. www.linkedin.com/in/paulavcosta