Visualizando dados: não deixe a ansiedade atrapalhar seu processo criativo

Explorando a transformação de dados de desemprego no Brasil na busca por uma visualização criativa

Fernando Hannaka
datavizbr
7 min readDec 8, 2020

--

Uma visualização de dados, assim como vários outros produtos criativos, nem sempre é atribuído o devido crédito pois depois de pronto parece que foi simples criá-la. Aquele bolo de chocolate da vovó, por exemplo, somente alguns ingredientes e pronto, maravilhoso! Mas quanto tempo ela não passou testando quais ingredientes usar, quais marcas, sem falar das inúmeras tentativas e todo o amor no processo.

Da mesma forma que o bolo da vovó, visualizações de dados também passam por várias transformações até chegarem na medida certa, na solução do problema. Este é o ponto inicial e final, entender qual problema a ser resolvido, realmente empatizar com o público-alvo e descobrir a dor que precisa ser aliviada para finalmente encontrar uma solução visual.

Por meio deste artigo quero passar como enfrentei esse processo de transformação, assim como mostrar a importância de gerenciar expectativas e que a persistência é fundamental para alcançar resultados desejados.

Identificação do problema

O cenário da força de trabalho é um assunto corrente nos noticiários, principalmente durante as crises como um fator de preocupação e motivador para tomada de decisões econômicas. O Instituto Brasileiro de Geografia e Estatística (IBGE) é uma ótima fonte confiável de informação, que disponibiliza vários dados sobre o mercado e a força de trabalho.

Um desses dados é a taxa de desocupação, mais conhecida como a taxa de desemprego, que são as pessoas ativas na força de trabalho que não estão empregadas por pelo menos 40h semanais. Vemos que esta taxa tem flutuações ao longo do tempo e que difere entre regiões do país.

Em termos de visualização de dados desta taxa já existem algumas ferramentas e gráficos, por exemplo o gráfico de pizza que mostrar a proporção de ocupados e desocupados, dentre outros. Uma ferramenta disponível no site do IBGE é o EstatGeo que mostra um mapa do Brasil, dividido por estado, com a taxa de desemprego representada através da saturação da cor, conforme a Figura 01.

Figura 01 - Mapa cloropético da taxa de desemprego por estado no 1o trimestre de 2020 (fonte: IBGE)

Gráficos de linha também são muito utilizados na mídia para representar a variação da taxa de desemprego ao longo do tempo, conforme Figura 02.

Figura 02 — Gráfico de linha da taxa de desemprego por estado, em destaque a média nacional

O público-alvo deste projeto eram economistas, analistas e tomadores de decisão, tanto da iniciativa privada quanto pública, para entender a situação da força de trabalho durante os anos visando a exploração e identificação de padrões ou outliers em cada região do país.

Através de ambos os gráficos apresentados acima é possível ver a diversidade das taxas de desemprego por localidade e alterações ao longo do tempo. Porém uma dificuldade do público-alvo, identificada por meio de observação, entrevista e convivência, é conseguir visualizar o comportamento da taxa de desemprego tanto do ponto de vista geográfico quanto temporal.

Fonte de inspiração

Uma vez identificado o problema o próximo passo foi encontrar inspiração. Portanto, estar exposto a uma variedade de visualização de dados, especialmente em áreas que não tem tanta familiaridade, é importante para criar um acervo mental pessoal que serve de inspiração para futuras criações.

Depois de analisar várias visualizações, tanto através de busca na internet quanto experiências pessoais, o gráfico inspirador escolhido para este projeto foi o mapa de calor publicado pelo The Wall Street Journal sobre o impacto de vacinas no combate a doenças nos estados dos Estados Unidos, que pode ser conferido na Figura 03.

Figura 03 — Mapa de calor do impacto da vacina contra sarampo por estado (fonte: WSJ)

Exploração e experimentação

O próximo passo foi explorar os dados. Muitas vezes pensamos que os dados são de um jeito mas podem estar representados de outra forma. Por exemplo, neste caso o IBGE fornece várias tabelas relacionadas a taxa de desocupação, em algumas a taxa já está calculada e em outras os dados são brutos. Diante da possível necessidade de agregar valores por tempo ou região, optou-se pelos dados brutos para possibilitar o cálculo exato em caso de uso de medidas de tendência central e dispersão.

De posse dos dados foram analisadas as variáveis disponíveis, o que cada uma delas representava e se havia necessidade de acrescentar ou calcular alguma nova variável. Uma variável que não existia na tabela fornecida pelo IBGE era as regiões as quais cada estado pertencia. Também foi necessário calcular a taxa de desemprego já que optou-se pela tabela que fornecia os dados brutos. Estas transformações, dentre várias outras, foram acrescidas para possibilitar a exploração dos dados e inclusão na visualização final.

Durante a exploração também foram analisados os dados por diferentes aspectos, incluindo possível sazonalidade nos dados e comportamento dos dados quando agrupados por região. Quanto à sazonalidade existe uma certa tendência das taxa de desemprego caírem à medida que se aproxima o último trimestre do ano, porém existem significativas exceções. Os estados pertencentes a uma região tendem a terem taxas próximas mas também não é um comportamento geral. Estes insights são fundamentais para futuras etapas de transformação e criação.

Finalmente, após explorar os dados, foi realizada uma experimentação dos dados da taxa de desemprego no inspirado mapa de calor.

Figura 04 — Mapa de calor da taxa de desemprego por estado

Reavalização

A Figura 04 apesar de mostrar diferenças em intensidade dependendo do estado, no geral mostra que a medida que o tempo passa a taxa de desemprego está crescendo, está ficando mais azul escuro. Porém, isto não agrega muita informação já que esta tendência também pode ser visualizada no gráfico de linhas da Figura 2.

Nesta fase de reavaliação é importante analisar o resultado da experimentação, pois nem sempre será possível alcançar o objetivo desejado de primeira, aqui entra a gestão da expectativa. Deve-se ter muita calma nessa hora e senso crítico para evitar qualquer conclusão precipitada e enviesada.

Olhando novamente para nosso público-alvo, que tem um objetivo exploratório dos dados, eles visam entender mudanças. Desta forma foi reavaliada a visualização e ao invés de representar a taxa de desemprego optou-se pela diferença da taxa de desemprego entre um trimestre e outro (taxa do trimestre atual menos a taxa do trimestre anterior).

Figura 05 — Mapa de calor da diferença trimestral da taxa de desemprego

Infelizmente esta tentativa da Figura 05 também não resultou em uma visualização que pudesse ser muito útil pois não fornece padrões. Após repensar os insights da fase exploratória, a solução para permitir visualização de tendências utilizando a diferença da taxa de desemprego entre trimestres foi calcular a média móvel, que suaviza flutuações de curto prazo, leva em consideração efeitos de sazonalidade e destaca tendências de longo prazo. Foi utilizada uma média móvel simples baseada no período de um ano, isto é, 4 trimestres. Trata-se de um indicador mais “lento” mas que pode ser mais robusto para uma análise exploratória. Veja na Figura 06 como as curvas foram suavizadas em relação a Figura 02.

Figura 06 — Gráfico de linha da média móvel da taxa de desemprego

Por meio destas transformações e após validação com economistas e experts em áreas correlatas, finalmente cheguei a visualização final que pudesse realmente apresentar os dados da taxa de desemprego para o público alvo de uma forma que incluísse a visão geográfica e temporal. Este gráfico continua representando a diferença entre trimestres, porém é utilizada a média móvel como taxa de desemprego, mostrando assim tendências e comportamentos fora do padrão. Na visualização foram contextualizados fatos sobre crises econômicas, políticas e sanitária no Brasil e incluída a opção de filtragem dos estados por região permitindo uma análise mais direcionadas. Confira o gráfico interativo através do link abaixo.

Clique aqui para visualização interativa

Figura 07 — Gráfico final

Conclusão

O bolo da vovó agora está pronto! Depois de pronto parece que foi simples já que o tipo de gráfico (mapa de calor) e o dado (taxa de desemprego) são velhos conhecidos. O que fez a diferença foi transformar o dado, misturar com uma escolha gráfica compatível e acrescentar uma pitada de perspectiva editorial para torná-la não somente visualmente atraente mas também entregando valor ao público-alvo.

Espero que o desenvolvimento desta visualização apresentada aqui possa servir para entender o processo criativo, tanto o lado técnico dos dados quanto de design, assim como a necessidade de controlar a ansiedade e manter um senso crítico ao longo de toda a jornada.

Agradecimento especial à professora Asla Medeiros e Sá e aos colegas da disciplina de Visualização da Informação da EMAp/FGV. Aos validadores desta visualização: Maria Tereza Rodrigues, Lisa Castilho, Rafael Ohmachi, Nathaniel Lawrence, Flávia Boechat, Diego de Brito e Bruno Ottoni. E a minha esposa e filha por sempre me apoiarem.

Fernando Hannaka é engenheiro de produção, autodidata, com propósito de transformar pessoas e organizações através da liderança empática e cultura analítica. Coautor de livros da Jornada Colaborativa, organizador do LatinR e fundador do perfil @visualizaçãodedados no Instagram.

--

--