¿Qué es HuggingFace? — Datos interesantes en IA

Paulo Tintaya Code
Datapath
Published in
5 min readFeb 12, 2024

Si estas interesado en adentrarse mas y mas en el mundo de la IA, es muy posible que en algún momento hayas escuchado sobre HuggingFace. Por lo que en este sector de datos interesantes con IA, exploramos el cómo podemos introducirnos al uso de esta plataforma.

Imagen 1: Logo de HuggingFace. Fuente: Plataforma comunidad HuggingFace.

¿Qué es HuggingFace?

HuggingFace es una comunidad de IA y ciencia de datos que proporcionó herramientas para construir, entrenar y desplegar soluciones de aprendizaje automático.
En la plataforma de la comunidad podremos encontrar modelos, datasets, y más. Con el objetivo de poder ayudar al aprendizaje y la contribución entre los miembros de la comunidad. Acá, cualquier persona puede empezar a colaborar y contribuir en una gran variedad de proyectos de código abierto relacionados a IA, ML y ciencia de datos.

Modelos

En esta plataforma nos encontraremos con más de 400 k+ modelos disponibles y de código abierto, esta cantidad se va incrementando mas y mas. Ya que hace solo un año contaba con solo 184k modelos disponibles.

Imagen 2: Modelos más usados en la plataforma. Fuente: Elaboración propia.

Acá exploramos una gran variedad de modelos, como:

  • Multimodal
  • Visión computarizada
  • Procesamiento de lenguaje natural(NLP)
  • Audio
  • Aprendizaje reforzado
Imagen 3: Variedad de modelos. Fuente: Elaboración propia.

Pero no solo miembros de la comunidad comparten sus proyectos, sino que también empresas muy conocidas en el mundo tech. Tales como Meta, AWS, Google, Microsoft y muchas más.

Imagen 4: Compañias que forman parte de HuggingFace. Fuente: Elaboración propia.

Ya explorando entre los distintos modelos nos toparemos que la plataforma también nos ofrece demos, tutoriales y más información sobre el uso de los modelos. Como en el caso de la imagen 5, exploramos el uso del modelo facebook/detr-resnet-50.

Imagen 5: Demo de uso de un modelo. Fuente: Elaboración propia.

Uso de un modelo

Para este corto ejemplo usaremos el modelo de SamLowe/roberta-base-go_emotions, un modelo para la clasificación de emociones en un texto. Para eso seguiremos la guía en la descripción del modelo.

Con el demo de la plataforma podremos realizar el análisis a la frase “I had a good time with my family”(Tuve un buen tiempo con mi familia.)

Imagen 6: Interfaz del modelo. Fuente: Elaboración propia.

Observando la imagen 7, podemos observar el uso de este modelo en código. Por lo cual usaremos la herramienta de Google Colab. Acá te dejo el enlace.

Imagen 7: Uso en código del modelo. Fuente: Elaboración propia.
Imagen 8: Resultado del análisis de emociones. Fuente: Elaboración propia.

Datasets

Para poder alimentar nuestros modelos de aprendizaje o realizar análisis de datos, es necesario contar con conjuntos grandes de información. Y justamente también encontraremos un gran sector de datasets en HuggingFace, incluso que llega a los 100k+ datasets.

Imagen 9: Datasets más usados. Fuente: Elaboración propia.

Podremos encontrar datasets para distintos propósitos, como áreas de medicina, música, arte, ciencias, comida, y muchos más. Al igual que tendremos la posibilidad de tener dataset en distintos idiomas.

Imagen 10: Idiomas disponibles de datasets. Fuente: Elaboración propia.

Spaces

Los espacios en HuggingFace son un apartado en la comunidad para poder dar a conocer y compartir los demos de modelos de Machine learning. Esta es una gran herramienta ya que te permitirá crear demostraciones del uso de tu modelo de una manera muy rápida e incluso sin tener conocimientos avanzados en programación.

Por lo que en la plataforma podremos encontrar más de 150k aplicaciones compartidas por la comunidad.

Imagen 11: Spaces de aplicaciones disponibles. Fuente: Elaboración propia.

Así que ahora probemos una de estas aplicaciones compartidas en Spaces, la aplicación AnimateLCM puede generar cortas animaciones basadas en un prompt textual. Para el ejemplo, usaremos el prompt “A boy playing the ukulele in the forest”(Un niño tocando el ukulele en el bosque). Podemos ver el resultado obtenido en la imagen 12.

Imagen 12: Resultado del uso de la app de generación de animaciones cortas. Fuente: Elaboración propia.

Conclusiones

En este artículo hemos llegado a conocer a HuggingFace y todo lo que nos ofrece en nuestro aprendizaje. Desde modelos open source implementados por miembros de la comunidad, hasta incluso algunos compartidos por compañias tech muy conocidas. Además de los dataset y spaces, para poder complementar aún más el uso que le demos a los distintos modelos que encontremos y claro poder seguir creciendo en comunidad.

Próximos Pasos

Bueno, ahora que ya sabemos incluso cómo utilizar un modelo de HuggingFace, nos toca explorar el resto de modelos y probarlos con re entrenamientos. Y también formar parte de la comunidad, no olvides que todos los proyectos son open source por lo que la colaboración es fundamental para el progreso de cada modelo. Te invitamos también a revisar los cursos ofrecidos en la misma plataforma de HuggingFace https://huggingface.co/learn, donde encontrarás los cursos disponibles sobre tratamiento de audios, NLP, y deep RL.

Referencias Bibliográficas

https://huggingface.co/

https://keepcoding.io/blog/que-es-hugging-face/

https://huggingface.co/docs/transformers/quicktour

https://huggingface.co/docs/hub/spaces

Gracias por leerme,

¿Quieres seguir aprendiendo y conectarte con nuestra comunidad? Te invitamos a unirte a nuestras redes sociales. ¡Síguenos en Instagram y LinkedIn para estar al tanto de las últimas noticias, tutoriales y recursos sobre tecnología y aprendizaje automático!

Datapath

Acelerando el talento LATAM en data, cloud, analytics e inteligencia artificial

Síguenos en nuestras redes sociales.

Síguenos en nuestras redes:

⚪DISCORD: https://go.datapath.ai/Discord_IALatam

🔵Linkedin: https://go.datapath.ai/Linkedin

🟡Instagram: https://go.datapath.ai/Instagram

🔴Facebook: https://go.datapath.ai/Facebook

🟢Tiktok: https://go.datapath.ai/Tiktok 🟣

--

--