Google Colab- Guia do Iniciante
Observação: Este post é a tradução de um artigo de Vishakha Lall, originalmente em inglês. Leia o artigo completo original: aqui.
Tradução: Sigrid Ferreira Rodrigues
Se você é um estudante interessado em explorar o Machine Learning, mas se esforça para realizar simulações em enormes conjuntos de dados, ou um especialista experimentando Machine Learning desesperado por poder computacional extra, o Google Colab é a solução perfeita para você. O Google Colab ou “Colaboratório” é um serviço de nuvem gratuito hospedado pelo Google para incentivar a pesquisa de Aprendizado de Máquina e Inteligência Artificial, onde muitas vezes a barreira para o aprendizado e o sucesso é a exigência de um tremendo poder computacional.
Benefícios do Colab
Além de ser fácil de usar (o que descreverei mais adiante), o Colab é bastante flexível em sua configuração e faz muito do trabalho pesado para você.
- Suporte para Python 2.7 e Python 3.6;
- Aceleração de GPU grátis;
- Bibliotecas pré-instaladas: Todas as principais bibliotecas Python, como o TensorFlow, o Scikit-learn, o Matplotlib, entre muitas outras, estão pré-instaladas e prontas para serem importadas;
- Construído com base no Jupyter Notebook;
- Recurso de colaboração (funciona com uma equipe igual ao Google Docs): o Google Colab permite que os desenvolvedores usem e compartilhem o Jupyter notebook entre si sem precisar baixar, instalar ou executar qualquer coisa que não seja um navegador;
- Suporta comandos bash;
- Os notebooks do Google Colab são armazenados no drive.
Se você preferir ler mais antes de começar, recomendo as perguntas frequentes sobre o Google Colab, a documentação do Google Colab e os Snippets de código e os conselhos da comunidade do Stack Overflow.
Vamos Começar!
Criando um notebook com o Colab
- Abra o Google Colab;
- Clique em “novo notebook” e selecione o notebook Python 2 ou o notebook Python 3.
OU
- Abra o Google Drive;
- Crie uma nova pasta para o projeto;
- Clique em ‘Novo’ > ‘Mais’> ‘Colaboratório’.
Configurando o acelerador de GPU
O hardware padrão do Google Colab é a CPU ou pode ser GPU.
- Clique em ‘Editar’> ‘Configurações do notebook’> ‘Acelerador de hardware’> ‘GPU’.
OU
- Clique em ‘Runtime’> ‘Hardware Accelerator’> ‘GPU’.
Executando uma célula
- Certifique-se de que o runtime esteja conectado. O bloco de anotações mostra uma marca verde e “Conectado” no canto superior direito;
- Existem várias opções de tempo de execução em “Runtime”.
OU
- Para executar a célula atual, pressione SHIFT + ENTER.
Comandos Bash
Os comandos de bash podem ser executados prefixando o comando com “!”.
- Clonando um repositório git
!git clone [git clone url]
- Comandos de diretório !ls, !mkdir.
!ls
Este comando gera as pastas / conteúdo e / drive (se ele foi montado). Execute o trecho a seguir para alterar a pasta atual.
import sys
sys.path.append(‘[nome da pasta]’)
Download da web
!wget [url] -p drive/[nome da pasta]
Instalando Bibliotecas
Embora a maioria das bibliotecas Python comumente usadas seja pré-instalada, novas bibliotecas podem ser instaladas usando os pacotes abaixo:
!pip install [nome do pacote]
OU
!apt-get install [nome do pacote]
Carregando arquivos locais
from google.colab import files
uploaded = files.upload()
Selecione os arquivos para upload
Para vários arquivos, os nomes das chaves individuais podem ser obtidos por meio de um loop pelos arquivos enviados.
for file in uploaded.keys():
print('Uploaded file "{name}" with length {length} bytes'.format(name=file, length=len(uploaded[file])))
Montando o Google Drive
Execute o seguinte código:
!apt-get install -y -qq software-properties-common python-software-properties module-init-tools
!add-apt-repository -y ppa:alessandro-strada/ppa 2>&1 > /dev/null
!apt-get update -qq 2>&1 > /dev/null
!apt-get -y install -qq google-drive-ocamlfuse fuse
from google.colab import auth
auth.authenticate_user()
from oauth2client.client import GoogleCredentials
creds = GoogleCredentials.get_application_default()
import getpass
!google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret} < /dev/null 2>&1 | grep URL
vcode = getpass.getpass()
!echo {vcode} | google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret}
Clique no link e insira a chave da API.
!mkdir -p drive
!google-drive-ocamlfuse drive
Seu drive está agora montado. Você pode usar quaisquer arquivos e pastas na sua unidade usando o caminho da seguinte maneira:
!ls /content/drive/[nome da pasta]
/ content é a pasta raiz do Google Colab e deve ser anexada a todos os caminhos usados no bloco de anotações.
Importando de .py scripts existentes
Carregue qualquer script .py existente em uma pasta na unidade. Considere um script “script.py” enviado para a pasta “Projeto”.
Para importar qualquer módulo
import sys
sys.path.append(‘Projeto’)
import script
Execute um .py script existente
Para executar um script:
!python3 /content/drive/Project/script.py
Verifique as especificações da CPU e RAM
!cat /proc/cpuinfo
!cat /proc/meminfo
Verifique as especificações da GPU
from tensorflow.python.client import device_lib
device_lib.list_local_devices()
O Colab fornece a GPU Tesla K80.
Isso deve te iniciar com o Google Colab. Sinta-se à vontade para perguntar!