Parte (4/4) — Criando uma origem de dados e o primeiro relatório com o Data Studio
Nesta última parte, vamos criar uma visualização básica dos dados com o Data Studio
Parte (1/2) — Pipeline de dados com a API do Cartola
Parte (2/3) — Configurando o Apache Airflow e o Google Storage
Parte (3/4) — Google BigQuery e as primeiras visualizações no Data Studio
Parte (4/4) — Adicionando novos gráficos e filtros personalizados
Em nossa última etapa desta jornada vamos criar alguns gráficos e entender um pouco o funcionamento da ferramenta da Google para criação de relatórios, o Data Studio.
Até o momento, criamos o nosso fluxo para extração de dados com o Airflow no Composer (Parte 2), com os dados salvos, fizemos uma consulta e salvamos uma visualização (Passo 3), agora vamos olhar para os dados e criar uma apresentação.
Para utilização do Data Studio, a primeira coisa que precisamos fazer é criar uma “Origem de Dados”, o que pode englobar um conjunto de diversas fontes como: ferramentas google (Sheets, Analytics, Ads, Seach Console, etc.) até arquivos CSV e o BigQuery. É possível também utilizar origens de terceiros ou criar a sua própria.
Em nosso caso utilizaremos o BigQuery como origem de dados e para adicioná-la vamos seguir os seguintes passos:
1 — Clicar em Criar e em Origem de dados
2 — Selecione a origem BigQuery
3 — Faça a conexão com o seu projeto
4 — Na tela que abrirá, você terá acesso a todas as colunas da sua tabela. Aqui você consegue alterar os tipos dos dados, colocar descrições e escolher as agregações padrão. Por hora não mudaremos nada e seguiremos para a criação do relatório.
5 — Ao clicar em “Criar Relatório”, somos redirecionados para a tela abaixo, clique no local indicado para concluir o processo de criação de um relatório a partir de uma fonte de dados.
Na interface de criação de relatório, você verá um conjunto de itens para manipulação dos gráficos e itens da tela. A área em branco (layout) é onde iremos inserir os componentes. Esta tela é editável pelo botão “Tema e Layout” no canto superior direito.
Para nosso tutorial, utilizaremos o tema Edge e criaremos um layout com os seguintes componentes:
- Uma forma retangular que fará a decoração superior do dashboard;
- Uma tabela com os jogadores que mais valorizaram na rodada;
- Um gráfico de barras com a pontuação média por posição;
Faixa Superior
Para criar a faixa superior basta clicar em Forma->Retângulo e adequar o tamanho conforme você julgar necessário.
Tabela com valorização
Temos duas formas de inserir um gráfico: podemos clicar no ícone “Adicionar um gráfico” e escolher o tipo preferido ou clicar no botão “Inserir”. Vamos seguir pela primeira forma e escolher uma “Tabela”.
Ao inserir a tabela, vamos observar no lado direito da tela e começar a conhecer suas propriedades. Em linhas gerais, um gráfico terá:
- Origem de dados — fonte de dados para geração dos gráficos;
- Dimensão do período — Dimensão utilizada para filtragem por período;
- Dimensão — uma coluna da sua tabela. Você pode adicionar mais de uma dimensão;
- Métrica — campos numéricos;
- Classificação — qual o campo e como será feita a ordenação dos dados;
- Filtro — filtragens personalizadas para aplicar ao conjunto de dados do gráfico;
Para esta tabela, vamos adicionar as seguintes dimensões: Nome e Clube; e a métrica “variacao_num”.
Você irá perceber que o nome da tabela é apresentado conforme o padrão da coluna, clicando sobre o botão “ABC” ao lado do nome, você consegui editar esta propriedade.
Em classificar, vamos escolher a forma “Decrescente”. Feito isto, vamos expandir um pouco a nossa tabela e seguir para o próximo gráfico.
Gráfico de Barras Pontuação Média
Agora vamos trabalhar com um novo tipo de componente, o gráfico de barras. Nele vamos aprender como trabalhar com a agregação pela média e vamos explorar algumas edições no estilo do gráfico. O processo para inserção é o mesmo utilizado para a tabela e não abordaremos nesta etapa. Com o gráfico criado, vamos alterar a métrica para utilizar a média da pontuação.
Em “Métrica” clique no campo em azul e no botão “Criar campo”.
Na caixa de texto, insira o texto conforme na imagem abaixo.
Tendo criado a métrica, vamos selecionar a dimensão para ser o nome da posição (lateral, zagueiro, goleiro, atacante, meia, técnico). Com isto ajustado vamos explorar a guia “Estilo”.
Em estilo, você consegue editar a cor das suas barras, a posição do gráfico, total de registros, e mais algumas opções para modificar o layout do seu gráfico.
Por hora vamos modificar a posição do gráfico de barros, convertendo para horizontal, trocar a cor e remover a legenda.
Na figura abaixo você consegue observar como modificar o orientação do gráfico e onde trocar a cor.
Para remover a legenda, role a barra de estilo até o final e selecione o primeiro item do grupo “Legenda”.
Por último, vamos adicionar um título para o gráfico. Para isto, vamos reduzir um pouco a área do gráfico e inserir um componente de texto.
Feito estes itens, podemos repetir o processo e criar novos gráficos e adicionar novos elementos na tela.
Por último, podemos compartilhar o relatório gerado clicando “Compartilhar”. Nesta opção conseguimos agendar um disparo de e-mail, convidar pessoas, tornar o link público e exportar o relatório para PDF.
Para este tutorial não ficar muito extenso, vamos parar por aqui.
Nestas 4 etapas o intuito foi mostrar, de uma maneira bem simples, como criar um fluxo de extração, tratamento e visualização dos dados utilizando a estrutura da Google Cloud Plataform.
Obrigado e até a próxima.