Visualização de Dados com Python: Ferramentas e Técnicas

Crie gráficos e visualizações impactantes para comunicar resultados de análise.

Vanderson Amorim
comunidadeds
8 min readNov 12, 2023

--

Em um mundo rodeado de dados por todas as partes, é trabalho do analista e cientista de dados transformar esse grande amontoado de dados em informações relevantes para a tomada de decisão. Para isso, é necessário uma estrutura de apresentação, técnicas e ferramentas para realizar o tratamento desses dados para criar visualizações impactantes e confiáveis.

Neste artigo, vou mostrar algumas técnicas e ferramentas da linguagem Python que podem ser utilizadas para este propósito.

1. Ferramentas de Visualização

Existem diversas bibliotecas que podem ser utilizadas para criar visualizações em Python, como o Matplotlib, Seaborn e o Plotly. Irei mostrar alguns pontos sobre cada uma dessas bibliotecas.

Para cada um dos gráficos que serão criados, iremos utilizar listas em Python que contém os dados necessários para a plotagem (o motivo para a criação de várias listas será explicada posteriormente):

meses = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio']
valores = [148, 325, 248, 192, 284]
frutas = ['Banana', 'Uva', 'Goiaba', 'Ameixa', 'Amendoim']
vendedores = ['Maria', 'Arnaldo', 'Eduardo', 'Bruno', 'Luiz']

1.1 Matplotlib

1.1.1 O que é Matplotlib?

O Matplotlib é uma biblioteca bem consolidada no Python, sendo a preferida de muitos profissionais. Mas como ela chegou nesse patamar?

Essa biblioteca nasceu em 2003 com o intuito de ter uma sintaxe simples e uma grande versatilidade na criação dos gráficos, sendo uma das bibliotecas mais customizáveis para criação de gráficos. Além disso, ela foi inspirada na sintaxe do MATLAB (uma linguagem de programação popular no ambiente acadêmico, usada para análise de dados e cálculos numéricos), o que diminuiu a curva de aprendizado para as pessoas que já estavam acostumadas com essa linguagem. Com todos esses elementos, sua comunidade cresceu rapidamente.

1.1.2 Instalando e Importando o Matplotlib

Comando para realizar a instalação:

pip install matplotlib

Para utilizarmos o matplotlib, precisamos determinar qual das sub-bibliotecas iremos utilizar e, na maioria das vezes, iremos usar apenas a sub-biblioteca de plotagem de gráficos, o pyplot, apelidando-o carinhosamente de plt para facilitar a sua chamada:

import matplotlib.pyplot as plt

1.1.3 Gráfico de Pizza

Para este gráfico ficar minimamente legível, precisamos das seguintes entradas:

  • x: Valores de cada fatia.
  • labels: identificador de cada fatia.

Vamos considerar que queremos um gráfico que compare as quantidades de cada fruta em relação ao total. Dessa forma, substituímos as entradas por seus respectivos valores e obtemos o seguinte gráfico:

1.1.4 Gráfico de Linha

Para este gráfico, basta informarmos os dados que estão no eixo x e no eixo y, respectivamente. Considerando um gráfico de linha que representa a evolução dos valores ao longo dos meses, temos:

1.1.5 Gráfico de Barras

De forma semelhante ao gráfico de barras, basta informarmos os dados do eixo x e do eixo y. Vamos considerar um gráfico entre os valores obtidos por cada vendedor:

1.2 Seaborn

1.2.1 O que é Seaborn?

O Seaborn é uma biblioteca que tem como base o matplotlib. Seu principal intuito é ter uma sintaxe mais simples e fácil quando comparada ao matplotlib, além de ter configurações predeterminadas para deixar o gráfico com uma aparência mais bonita, facilitando a personalização do gráfico, apesar de ser menos permissível quando comparada ao matplotlib.

1.2.2 Instalando e Importando o Seaborn

Comando para realizar a instalação:

pip install seaborn

Para utilizarmos o Seaborn, precisamos importá-lo para nosso código, apelidando-o de sns para facilitar a sua chamada:

import seaborn as sns

Como queremos demonstrar a capacidade de fácil personalização do seaborn, vamos adicionar linhas aos eixos dos gráficos e alterar a paleta de cores usando os seguintes comandos:

sns.set_style('whitegrid')
sns.set_palette('Set2')

Para ver as paletas de cores disponíveis e outras opções de personalização do seaborn, você pode conferir os links de referência no final do artigo, onde anexei a documentação oficial da biblioteca.

1.2.3 Gráfico de Pizza

Lembra que falei que o seaborn tem o matplotlib como base? Então, o seaborn não possui um comando próprio para a criação de um gráfico de pizza e utiliza o mesmo comando que o matplotlib. Mas como alteramos o tema do seaborn anteriormente, o nosso gráfico ficará diferente:

1.2.4 Gráfico de Linha

Para construir esse gráfico, basta identificarmos onde estão os dados do eixo x e do eixo y:

1.2.5 Gráfico de Barras

De forma semelhante ao gráfico de linhas, basta identificarmos os dados de cada eixo:

1.3 Plotly

1.3.1 O que é Plotly?

O Plotly é uma biblioteca Python focada na criação de gráficos interativos, sendo uma ótima escolha para criação de gráficos em dashboards online, tornando a análise de dados mais intuitiva e acessível.

1.3.2 Instalando e Importando o Plotly

Comando para realizar a instalação:

pip install plotly

Para utilizarmos o Plotly, precisamos importá-lo para nosso código,determinando a sub-biblioteca express, que permite criar gráficos de forma mais fácil e rápida:

import plotly.express as px

1.3.3 Gráfico de Pizza

A forma como os dados são inseridos nesse gráfico é parecido com a construção do gráfico no matplotlib, mudando apenas os nomes das entradas:

  • values: Valores de cada fatia.
  • names: identificador de cada fatia.

Dessa forma, conseguimos construir um gráfico de pizza interativo:

1.3.4 Gráfico de Linha

Novamente, basta inserirmos as informações de cada eixo para plotar o nosso gráfico:

1.3.5 Gráfico de Barras

Por fim, para criarmos o nosso gráfico de barras no Plotly, fornecemos os dados de cada eixo:

2. Técnicas

Técnicas para melhorar a confiabilidade e visualização da sua análise

Não só de gráficos vive um profissional da área de dados. Afinal, do que adianta gráficos lindos se o público não entende a mensagem que queremos transmitir, ou pior, transmitimos a ideia errada!? Para auxiliar nessa tarefa, trago algumas técnicas que ajudam no processo de criação de gráficos e visualizações mais corretas e assertivas.

2.1 Limpeza e Tratamento dos Dados

Para fazermos uma análise assertiva de um conjunto de dados, é necessário efetuar a limpeza e tratamento dos dados. Mas o que significa esses termos?

A limpeza de dados consiste em identificar e corrigir erros nos dados, como valores ausentes, valores duplicados, dentre outros.

No tratamento dos dados, fazemos modificações para padronizar os dados, alterar a unidade métrica de uma coluna, dentre outras atividades.

Com isso, conseguimos uma base de dados limpa e consistente, permitindo-nos realizar uma análise confiável e assertiva.

2.2 Planejamento da Visualização

Antes de criarmos qualquer gráfico para a apresentação final, devemos fazer um planejamento geral de como queremos transmitir as informações que extraímos dos conjuntos de dados, usando ferramentas como o Draw.io e Excalidraw. Com isso, conseguimos ter uma visão mais macro do nosso projeto, facilitando nossa caminhada e detectando os possíveis problemas que possam ocorrer.

Exemplo de planejamento no Draw.io

2.3 Sugestões de Melhoria da Legibilidade

Uma dúvida frequente de iniciantes na análise de dados é saber qual tipo de gráfico usar em cada situação. A imagem abaixo nos ajuda a escolher o tipo de gráfico em cada contexto:

Este é o motivo pelo qual decidi utilizar as 4 listas para compor os nossos gráficos. De forma resumida, utilizando a imagem acima, temos:

  • Gráfico de barras: Quis mostrar a comparação entre itens com uma variável por item, com poucas categorias e poucos itens. Dessa forma, consigo mostrar de forma clara como cada vendedor está performando quando comparado aos seus colegas.
  • Gráfico de linha: Quis mostrar a comparação ao longo do tempo com muitos períodos e não cíclico. Dessa forma, consigo mostrar como está a evolução dos valores ao longo do tempo, vendo de forma mais clara se está aumentando ou diminuindo quando comparado ao período anterior ou ao início do período.
  • Gráfico de pizza: Quis mostrar a composição estática simples em relação ao total. Dessa forma, consigo analisar como está a composição do todo em relação aos itens.

Um ponto a destacar sobre o gráfico de pizza é que ele não é recomendado para representar mais do que 5 fatias. Com mais de 5 fatias se torna mais difícil de distinguir cada categoria e isso dificulta a análise que o gráfico quer transmitir:

Por fim, para facilitarmos o entendimento de cada gráfico, podemos adicionar um título resumindo a informação que nosso gráfico quer transmitir:

3. Conclusão

Uma boa análise de dados é de grande importância porque torna as informações complexas mais acessíveis, compreensíveis e utilizáveis. Com isso, facilitamos o acesso aos insights contidos em um conjunto de dados para as equipes de negócio responsáveis pela tomada de decisão.

A linguagem Python é uma ferramenta poderosa e versátil para análise de dados. Com este artigo você pôde ter uma visão geral de como utilizá-lo para criar visualizações capazes de transmitir as valiosas informações contidas em um conjunto de dados.

Ficou com alguma dúvida ou tem alguma sugestão? Fique à vontade para deixar nos comentários ou entrar em contato comigo pelo meu LinkedIn: Vanderson Amorim | LinkedIn

Referências

matplotlib.pyplot.pie — Matplotlib 3.8.1 documentation

matplotlib.pyplot.plot — Matplotlib 3.8.1 documentation

matplotlib.pyplot.bar — Matplotlib 3.8.1 documentation

Controlling figure aesthetics — seaborn 0.13.0 documentation (pydata.org)

Choosing color palettes — seaborn 0.13.0 documentation (pydata.org)

seaborn.lineplot — seaborn 0.13.0 documentation (pydata.org)

seaborn.barplot — seaborn 0.13.0 documentation (pydata.org)

Pie charts in Python (plotly.com)

Line charts in Python (plotly.com)

Bar charts in Python (plotly.com)

How to choose the right chart for your data| Biuwer Analytics

--

--