Optimizando tu Flujo de Trabajo: Explora Cómo Cargar y Descargar Datasets usando la API de Kaggle y Google Colab
En este tutorial, aprenderemos cómo aprovechar la potencia de la API de Kaggle junto con Google Colab para simplificar la carga y descarga de conjuntos de datos. Descubriremos cómo instalar la librería Kaggle, conectarla con tu cuenta y explorar los conjuntos de datos disponibles. Además, exploraremos cómo descargar directamente los archivos a Google Drive, lo que facilitará la gestión y acceso a los datos.
Paso 1: Instalar la librería Kaggle
!pip install -q kaggle
Paso 2: Importar el sistema de archivos de Colab
from google.colab import files
Paso 3: Crear y cargar la API key de Kaggle
- Ve a Kaggle > cuenta > baja hasta API.
- Haz clic en “Create New API Token” y descarga el archivo .json.
- Carga el archivo .json usando el módulo “files”.
files.upload()
- Crea una carpeta oculta para las credenciales y copia el archivo en ella.
!mkdir ~/.kaggle
!cp kaggle.json ~/.kaggle/
- Cambia los permisos del archivo para permitir la lectura.
!chmod 600 ~/.kaggle/kaggle.json
Paso 4: Probar la conexión a la API de Kaggle Listar algunos conjuntos de datos disponibles.
!kaggle datasets list
Paso 5: Descargar un archivo desde Kaggle a Google Drive
- Ve a la página del conjunto de datos, selecciona un dataset de tu preferencia y copia el comando API que está en la parte superior derecha.
- Ejecuta el comando para descargar el conjunto de datos.
!kaggle datasets download -d berkeleyearth/climate-change-earth-surface-temperature-data
Paso 6: Montar Google Drive en Colab
- Importa la librería “drive” y monta la unidad.
from google.colab import drive
drive.mount('/content/drive/')
Paso 7: Descomprimir el archivo en Google Drive
- Crea un directorio en tu Google Drive.
!mkdir '/content/drive/My Drive/Colab Notebooks/db/'
- Descomprime el archivo en el directorio creado.
!unzip climate-change-earth-surface-temperature-data.zip -d '/content/drive/My Drive/Colab Notebooks/db/'