Guia explicativo para usar o Google Colab focado em Ciência de Dados

Leonardo Caldeira
6 min readNov 5, 2019

--

Vamos aprender a utilizar o Google Colab focados em Ciência de Dados?

Olá, meu caro amigo cientista de dados, tudo bem com você?
Este vai ser um guia explicando o básico para você conseguir fazer tudo o que precisar com a ferramenta online poderosíssima chamada Google Colab.

Atualmente, existem muitas IDE para que você programe em Python.

  • IDE — do inglês Integrated Development Environment ou Ambiente de Desenvolvimento Integrado, é um programa de computador que reúne características e ferramentas de apoio ao desenvolvimento de software com o objetivo de agilizar este processo.

Vou deixar aqui com vocês um link para que vocês conheçam ou testem algumas delas: https://python.org.br/ferramentas/

Eu particularmente, só utilizei até hoje o Google Colab e o Visual Studio Code destas citadas mas gostaria ainda de testar a PyCharm, o Spyder e o Rodeo.

Visual Studio Code
Uma imagem do meu companheiro de muitos anos chamado Visual Studio Code desenvolvido pela Microsoft.

Acho que fugi um pouco do assunto. Voltando ao tema deste guia, acredito que ir marcando em vermelho os locais das explicações, fica mais fácil de entender, então, siga nas imagens abaixo.
Seria bom se você abrisse o link abaixo e fosse acompanhando comigo: https://colab.research.google.com/notebooks/welcome.ipynb#scrollTo=KI4uSKcGTm3o

Google Colab — Menu e Título.
Estes bem no topo são o título do seu arquivo e a barra de menus.

Onde está escrito “Bem-vindo ao Google Colab” você pode alterar para o que quiser, este será o nome do seu arquivo.

Abaixo podemos ver a barra de menus.
Na aba File, podemos ver as informações principais sobre este arquivo.
Eu particularmente não utilizo nada desta aba.

Já na aba Edit, quando você está modificando seu arquivo e exclui uma linha sem querer, é possível voltá-la apenas clicando em “Edit > Undo delete 1 cells”. Isso sempre me foi muito útil.

Google Colab — Edit.
Google Colab — Edit.

Também tem a opção “Clear all outputs” que limpa todos os resultados do seu código, fazendo com que o arquivo seja carregado mais rapidamente e “Notebook settings”, onde você pode escolher a versão do Python que deseja rodar e se gostaria de usar None (CPU normal), GPU (processamento mais rápido) e TPU (utilizada para processar o framework TensorFlow mais rapidamente ainda). Nós utilizamos apenas a GPU mesmo.

Google Colab — Notebook settings.
Google Colab — Notebook settings.

Voltando ao topo do arquivo, a estrela ao lado do título é para marcar este arquivo como favorito no seu Google Drive (este é um velho amigo dos estudantes e serve para você armazenar 15GB de informações gratuitamente). Quando você salvar este arquivo, ele será salvo automaticamente no Google Drive da conta que está logada no navegador.

Assim, acabamos de falar das 2 primeiras abas. As próximas 2 (View e Insert) até hoje não precisei para nada, então vamos pular elas.

Já a aba Runtime controla toda a execução do seu arquivo. Ou seja, você pode abrir um arquivo com seu código já pronto e clicar em “Runtime > Run All”. O Colab vai passar por todas as linhas do seu código e gerar as saídas.

Google Colab — Saída.
Google Colab — A saída sempre fica abaixo do seu código, neste caso: 86400.

Além de pedir para o Colab executar todo o seu código, você pode pedir para ele pausar uma execução que está demorando muito ou parar e executar tudo novamente ou visualizar todas as sessões com códigos ativos.

Google Colab — Sessões ativas.
Google Colab — Visualizar sessões ativas.

A aba Tools é responsável por todo o controle no Notebook. Cada arquivo dentro do Google Colab é chamado de Notebook. Aqui podemos ver todas as teclas de atalhos e ainda alterar as preferências que queremos. No meu caso, escolhe o modo escuro de notebook.

Google Colab — Dark mode.
Google Colab — Selecionando o modo escuro em Theme > Dark.

Parece que finalmente acabamos o menu. Não foi tão pesado, não é?
No fim deste post, vamos recapitular todo o aprendizado para você fixar no que mais irá utilizar.

Prosseguindo, a esquerda na tela temos outras opções para alterarmos nosso Notebook.

Google Colab — Outras opções.
Google Colab — Opções principais.

Você pode clicar em “+ Code” para abrir uma janela de código assim:

Google Colab — Code.
Google Colab — Campo para você digitar o seu código.

Notou que essa janela possui um botão de Play? Após digitar o seu código, basta clicar neste botão para ver se funcionou ou não. Lembra da saída de 86400 que vimos acima? Isso significa que seu código executou perfeitamente e teve uma saída.

Clicando na opção “+ Text”, você terá um campo de texto com algumas opções básicas de formatação. Isso irá lhe ajudar a agrupar o seu código no futuro de uma forma bem útil.

Google Colab — Text.
Google Colab — Campo para você digitar um texto.

Quando utilizamos uma hashtag neste campo de texto e digitamos por exemplo “##Resumo do código”, este título aparece ali na aba Table of contents como uma sessão. Uma sessão é como se fosse um título que contém subtítulos, textos e códigos dentro dele, ok?

Google Colab — Table of contents.
Google Colab — Table of contents é o local onde ficam as sessões.

Sabe quando você abre o Word e ele mostra vários modelos e templates pra você escolher? A aba Code snippets é igual. Ela mostra alguns exemplos de códigos, então basta clicar 2x em cima de algum e depois mandar executar.
Antes de você fazer isso, recomendo que primeiro exclua todos os campos de código e texto que possua no seu notebook ou use a opção “File>New python 3 notebook” para abrir um novo, assim terá certeza que apenas aquele exemplo irá rodar ;)

Google Colab — Files.
Google Colab — Files é o local onde ficam os seus arquivos temporários.

Uma das abas mais importantes do Google Colab é a Files. É nela que ficam salvos seus arquivos auxiliares que, normalmente, são seus dados a serem explorados.

Para enviar seus arquivos com dados para cá, basta arrastá-los para esta área (no espaço cinza abaixo de sample_data) e soltar ou clicar em UPLOAD e encontrar o seu arquivo na janela que irá abrir.

Chegamos ao fim pessoal, espero que tenham gostado deste tutorial bem simples sobre o Google Colab. Eu expliquei apenas alguns pequenos pontos para que você já possa sair utilizando essa ferramenta poderosa sem precisar instalar nem configurar nada no seu computador e assim, pode executar seus notebooks até do celular.

Recapitulando:

Notebook: É o seu arquivo inteiro com todos os códigos e textos.
Python: Linguagem de programação mais utilizada para Ciência de Dados na atualidade (2019–2020).
GPU: Opção que faz seu código executar mais rápido.
+ Code: Janela para você digitar código no seu Notebook.
+ Text: Janela para você digitar texto no seu Notebook.
Botão Play: Botão que executa aquela janela de código.
Files: Lugar onde você deve colocar seu dataset (conjunto de dados).
Google Drive: Ferramento online do Google que te dá 15GB gratuitos de espaço para você salvar o que quiser.
Google Colab: Ferramenta online do Google que possui todas as funções acima citadas e muito mais que exploraremos no futuro.

É isso pessoal, espero que tenham gostado e que realmente utilizem o básico para que futuramente consigam ganhar dinheiro criando seus códigos pelo Colab.

Caso queiram utilizar este outro tutorial que fiz como exemplo de Notebook, fiquem a vontade:
Exemplo do uso de K-means.

Um grande abraço.

--

--