Los Highlights de Febrero
Las últimas novedades de AI que tenés que saber
Un Oscar a Sora
OpenAI la sigue rompiendo y en esta ocasión nos presento a Sora, un modelo text-to-video de gran escala capaz de producir videos de alta definición. Sora es un modelo de difusión latente que aprendió a transformar ruido en videos utilizando una arquitectura de transformador que opera en parches espaciotemporales de códigos latentes de vídeo e imagen. El sistema fue entrenado con videos de hasta 1.920 x 1.080 píxeles y tienen una duración de hasta un minuto.
Gemini mas potente que nunca
Google anunció el lanzamiento de Gemini 1.5, la última versión de su potente modelo de inteligencia artificial. Esta nueva versión promete una arquitectura mejorada, una ventana de contexto descomunal y una mayor eficiencia. Gemini 1.5 Pro puede procesar grandes volúmenes de datos en diversos formatos, incluyendo video, texto e imágenes. La versión disponible para todo público puede gestionar hasta 128k de tokens pero una versión exclusiva disponible para un grupo limitado de desarrolladores puede procesar hasta 1 millón de tokens.
Aunque sus capacidades son increíbles sobre texto, recientemente se agregó una nueva funcionalidad al modelo que genera imágenes a partir del prompt insertado que resulto no estar funcionando tan bien. Muchas imágenes circularon sobre las redes de imágenes históricas no tan precisas debido a que el modelo esta entrenado para sacar todo estereotipo.
Modelos locales en tu laptop
Siguiendo con noticias de Google, en esta ocasión conocemos a Gemma, una nueva familia de modelos de inteligencia artificial de última generación que prometen superar a la competencia. Estos modelos, construidos sobre la misma tecnología utilizada para Gemini, se ejecutan localmente en dispositivos de escritorio o portátiles, marcando un cambio significativo en la forma en que se accede y se utiliza la IA. Con tamaños que van desde 2,000 millones hasta 7,000 millones de parámetros, Gemma ofrece variantes pre-entrenadas y ajustadas a las necesidades específicas del usuario.
Stability siempre a la vanguardia en la generación de imágenes
Stability AI anunció Stable Diffusion 3, que ofrece una amplia gama de parámetros que van desde los 800 millones hasta los 8 mil millones. Esta variabilidad permite que diferentes versiones del modelo se adapten y se ejecuten localmente en una variedad de dispositivos, desde celulares hasta servidores. La arquitectura de transformador de difusión utilizada en Stable Diffusion 3 es una innovadora forma de generar imágenes con inteligencia artificial, que trabaja área por área en la imagen, inspirada en la eficiencia de los transformadores para manejar patrones y secuencias.