JupyterHub do Grupo Soma

Lucas de Andrade Cerqueira
soma-labs
Published in
3 min readOct 19, 2018

Esse post tem como alvo os funcionários do Grupo Soma, mas sinta-se à vontade para ler até o final. Se quiser saber mais sobre o JupyterHub e como fazer o deploy em um servidor, dê uma olhada nesse link.

Jupyter

Para quem não conhece, o Jupyter é uma aplicação web para criar e compartilhar códigos, gráficos, visualizações interativas e textos em documentos chamados notebooks, que podem ser exportados para páginas HTML, PDF ou scripts. Essa aplicação existe para diversas linguagens, dentre elas Python, C++, Julia e R. No nosso caso, vamos utilizar Python.

O JupyterHub é uma solução para que diversos usuários possam criar notebooks acessando um portal com o objetivo de prototipar scripts em Python para automatizar tarefas, fazer análises de dados e gerar visualizações que podem ser exportadas posteriormente.

Como acessar?

Para acessar o portal da empresa, basta acessar https://jupyter.somagrupo.com.br e você verá uma tela como essa:

Homepage do JupyterHub

Ao clicar em “Entrar”, você verá uma tela como na imagem abaixo para logar com seu email e senha da empresa:

Tela do login institucional

Depois do login bem-sucedido, você já vai ver sua página principal. Nela ficam seus arquivos, notebooks e pastas que podem ser criados clicando no botão “New” no canto direito. Também existe a opção de fazer upload de arquivos como csv, planilhas do Excel e queries clicando no botão “Upload”.

Sistema de arquivos do usuário

Sobre o notebook

Agora, vamos criar um notebook simples para executar alguns códigos em Python que serão muito úteis. Primeiro, crie um notebook de Python 3 clicando no botão “New”. Em seguida, você verá uma tela como na imagem abaixo. Não se assuste com a interface, é mais simples do que parece e os atalhos de teclado ajudam muito. Sempre que esquecer algum atalho, só clicar no ícone com um teclado que está realçado na imagem.

Tela após criar um novo notebook.
Lista de atalhos de teclado.

Estrutura do notebook

O notebook é composto de diversas células que podem conter código em Python ou texto e são executadas separadamente. A célula que estiver selecionada fica realçada de verde (modo de edição) ou azul (modo de comando). No modo de edição, o que você digitar no teclado irá alterar o conteúdo da célula; no modo de comando, as teclas apertadas serão interpretadas como atalhos, por isso que alguns atalhos da lista da imagem acima precisam que a célula estejam no modo de comando(command mode) para serem executados.

Uma célula do notebook pode ser do tipo Code (código) ou Markdown (texto). Nesse artigo, não vou falar de Markdown. Se quiser saber mais, dê uma olhada aqui.

Atalhos básicos

  • Entrar no modo de edição: (modo de comando) Enter
  • Entrar no modo de comando: (modo de edição) Esc
  • Executar a célula atual e selecionar a próxima: Shift + Enter
  • Copiar célula: (modo de comando) C
  • Colar célula: (modo de comando) V
  • Deletar célula: (modo de comando) D, D (2x a tecla D)
  • Adicionar célula acima (above) da atual: (modo de comando) A
  • Adicionar célula abaixo (below) da atual: (modo de comando) B

Códigos básicos

Carregando um arquivo csv

Basta fazer o upload de um csv para seu sistema de arquivos e executar o exemplo abaixo trocando o nome do arquivo.

Carregando um .csv

Carregando uma planilha do Excel

Depois de fazer o upload de uma planilha do Excel, basta executar o exemplo abaixo para carregar a planilha em uma variável passando o nome do arquivo e depois o nome da aba em sheet_name .

Carregando uma planilha do Excel.

--

--