Los Highlights de Febrero

Delfina Iriarte
Data & AI Accenture Argentina
3 min readMar 6, 2024

Las últimas novedades de AI que tenés que saber

Un Oscar a Sora

Video introductorio de OpenAI

OpenAI la sigue rompiendo y en esta ocasión nos presento a Sora, un modelo text-to-video de gran escala capaz de producir videos de alta definición. Sora es un modelo de difusión latente que aprendió a transformar ruido en videos utilizando una arquitectura de transformador que opera en parches espaciotemporales de códigos latentes de vídeo e imagen. El sistema fue entrenado con videos de hasta 1.920 x 1.080 píxeles y tienen una duración de hasta un minuto.

🔗 Leé la historia completa acá

Gemini mas potente que nunca

Google anunció el lanzamiento de Gemini 1.5, la última versión de su potente modelo de inteligencia artificial. Esta nueva versión promete una arquitectura mejorada, una ventana de contexto descomunal y una mayor eficiencia. Gemini 1.5 Pro puede procesar grandes volúmenes de datos en diversos formatos, incluyendo video, texto e imágenes. La versión disponible para todo público puede gestionar hasta 128k de tokens pero una versión exclusiva disponible para un grupo limitado de desarrolladores puede procesar hasta 1 millón de tokens.

Aunque sus capacidades son increíbles sobre texto, recientemente se agregó una nueva funcionalidad al modelo que genera imágenes a partir del prompt insertado que resulto no estar funcionando tan bien. Muchas imágenes circularon sobre las redes de imágenes históricas no tan precisas debido a que el modelo esta entrenado para sacar todo estereotipo.

🔗 Leé la historia completa acá

Modelos locales en tu laptop

Siguiendo con noticias de Google, en esta ocasión conocemos a Gemma, una nueva familia de modelos de inteligencia artificial de última generación que prometen superar a la competencia. Estos modelos, construidos sobre la misma tecnología utilizada para Gemini, se ejecutan localmente en dispositivos de escritorio o portátiles, marcando un cambio significativo en la forma en que se accede y se utiliza la IA. Con tamaños que van desde 2,000 millones hasta 7,000 millones de parámetros, Gemma ofrece variantes pre-entrenadas y ajustadas a las necesidades específicas del usuario.

🔗 Leé la historia completa acá

Stability siempre a la vanguardia en la generación de imágenes

Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says “Stable Diffusion 3” made out of colorful energy

Stability AI anunció Stable Diffusion 3, que ofrece una amplia gama de parámetros que van desde los 800 millones hasta los 8 mil millones. Esta variabilidad permite que diferentes versiones del modelo se adapten y se ejecuten localmente en una variedad de dispositivos, desde celulares hasta servidores. La arquitectura de transformador de difusión utilizada en Stable Diffusion 3 es una innovadora forma de generar imágenes con inteligencia artificial, que trabaja área por área en la imagen, inspirada en la eficiencia de los transformadores para manejar patrones y secuencias.

🔗 Leé la historia completa acá

--

--