Los Highlights de marzo

Las últimas novedades de AI que tenés que saber

Clara Villalba
Data & AI Accenture Argentina
4 min readApr 4, 2024

--

Devin, el primer ingeniero de software de IA

Conocé a Devin, el primer ingeniero de software completamente autónomo del mundo. Devin puede planificar y ejecutar tareas de ingeniería complejas que requieren miles de decisiones. Puede recordar el contexto relevante en cada paso, aprender con el tiempo y corregir errores. También cuenta con herramientas comunes para desarrolladores, incluyendo la terminal, editor de código y un navegador dentro de un entorno de cómputo aislado, todo lo que un humano necesitaría para realizar su trabajo. Tiene la capacidad de colaborar activamente con el usuario. Devin informa sobre su progreso en tiempo real, acepta retroalimentación y trabaja junto al usuario a través de decisiones de diseño según sea necesario. Un ejemplo de lo que Devin puede hacer:

  • Aprender a utilizar tecnologías desconocidas.
  • Construir e implementar aplicaciones de principio a fin
  • Encontrar y corregir errores en código de manera autónoma
  • Entrenar y fine-tunear sus propios modelos de inteligencia artificial

🔗Conocé más sobre Devin acá

Apple presenta MM1, una nueva IA que podría vitaminar a Siri

Apple presentó MM1, una familia de grandes modelos multimodales de lenguaje (MLLM, por sus siglas en inglés) basados en inteligencia artificial (IA). El desarrollo podría ser la base de la esperada actualización de Siri. El trabajo detalla una técnica que ocupa un conjunto de información sintética conformado por imágenes subtituladas, materiales de texto puro y datos visuales y de texto intercalados. La propuesta añade codificadores de imágenes y conectores de lenguaje de visión. El resultado es un proceso de entrenamiento que combina diferentes tipos de datos de entrenamiento y arquitecturas de modelos, en lugar de depender de uno solo. El grupo de modelos multimodales tiene hasta 30,000 millones de parámetros de contexto que logran métricas de preentrenamiento y un rendimiento similar al observado en otros sistemas de última generación como GPT-4 y Claude 3. La herramienta es capaz de comprender y generar lenguaje basado en indicaciones visuales y lingüísticas de forma simultánea. Los hallazgos de la compañía fueron documentados en el paper MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training

🔗 Leé la historia completa acá

Dos inteligencias artificiales conversan entre sí

Realizar una nueva tarea basada únicamente en instrucciones verbales o escritas, y luego describirla a otros para que puedan reproducirla, es un pilar de la comunicación humana que aún resiste a la inteligencia artificial (IA). Un equipo de la Universidad de Ginebra (UNIGE) ha logrado modelar una red neuronal artificial capaz de esta destreza cognitiva. Después de aprender y realizar una serie de tareas básicas, esta IA fue capaz de proporcionar una descripción lingüística de las mismas a una IA “hermana”, que a su vez las ejecutó. Este modelo abre nuevos horizontes para comprender la interacción entre el lenguaje y el comportamiento. Es particularmente prometedor para el sector de la robótica, donde el desarrollo de tecnologías que permitan a las máquinas comunicarse entre sí es un tema clave.

🔗 Leé la historia completa acá

NVIDIA presenta la arquitectura Blackwell para impulsar la próxima ola de IA de próxima generación.

NVIDIA-GB200-Grace-Blackwell-Superchip

NVIDIA ha anunciado su arquitectura de GPU Blackwell de próxima generación. La plataforma Blackwell promete hasta 25 veces menor costo y consumo de energía en comparación con su predecesora, la arquitectura Hopper. Nombrada en honor al pionero matemático y estadístico David Harold Blackwell, la nueva arquitectura de GPU introduce seis tecnologías transformadoras. Las principales innovaciones en Blackwell incluyen el chip más potente del mundo con 208 mil millones de transistores, un Motor Transformer de segunda generación para admitir el doble de capacidad de cálculo y tamaño de modelos, la interconexión NVLink de quinta generación para comunicación de alta velocidad entre múltiples GPU, y motores avanzados para fiabilidad, seguridad y descompresión de datos.

🔗 Leé la historia completa acá

Databricks anuncia DBRX

DBRX supera a otros modelos de código abierto

Databricks ha anunciado el lanzamiento de DBRX, un poderoso nuevo modelo de lenguaje de máquina de código abierto que afirma establecer un nuevo estándar para los modelos abiertos al superar a opciones establecidas como GPT-3.5 en pruebas de la industria. La compañía afirma que el modelo DBRX de 132 mil millones de parámetros supera a modelos populares de LLM de código abierto como LLaMA 2 70B, Mixtral y Grok-1 en tareas de comprensión del lenguaje, programación y matemáticas. Incluso supera al modelo de código cerrado de Anthropic, Claude, en ciertas pruebas.

🔗 Leé la historia completa acá

--

--