Los highlights de septiembre

Delfina Iriarte
Data & AI Accenture Argentina
3 min readSep 28, 2023

--

Las últimas novedades de AI que tenés que saber.

Dibuje DALLE-3, dibuje 🎨

Ilustración de una palta sentada en una silla de terapista, diciendo ‘‘I just feel so empty inside’ con un agujero en su centro. El terapista, una cucharita, toma notas. Imagen de OpenAI

OpenAI anuncia la tercera generación de DALLE. Con un mayor entendimiento y detalle que sus versiones anteriores, DALLE-3 permite generar imágenes de la misma calidad que su competidor MidJourney. Una de las novedades más esperadas es que DALLE-3 es que va a estar integrado con ChatGPT, permitiendo insertar imágenes como prompt o pidiéndole que genere imagenes.

Aunque muchos se divirtieron jugando con mini-Dalle lamentablemente esta versión aun no está disponible para el público y va a encontrarse integrado con las versiones de ChatGPT Plus and Enterprise.

Link 🔗

Windows ya no viaja solo🚀

Microsoft anunció Copilot for Windows “tu compañero AI para el día a día”. La experiencia ahora está enfocada en la productividad, con mas de 150 nuevas funciones y mejoras basadas en AI en aplicaciones como Paint, Fotos, Clipchamp, entre otras. Sin olvidar su partnership con OpenAI, no solo estamos hablando de Copilot sino también de la integración de DALLE-3 en su navegador Bing.

Copilot está disponible de manera gratuita en Windows 11 desde el 26 de Septiembre.

Link 🔗

Mojo, el nuevo lenguaje para los desarolladores de IA 🔥

Mojo ya se encuentra disponible para Linux y Windows. Mojo es un lenguaje de programación muy similar a Python pero con el rendimiento de C/C++. Posee la misma sintaxis que Python haciendo que sea fácil de aprender y permite importar casi cualquier biblioteca de Python pero con una complejidad computacional comparable a C++ o CUDA.

No por nada a Mojo se lo conoce como Python++.

Link 🔗

GenAI y Música: presentando Stable Audio 🎵

Imagen de https://stability.ai/stable-audio

La empresa responsable de Stable Diffusion, Stability.ai, lanzo Stable Audio, una modelo con arquitectura de difusión latente que genera música y efectos de sonidos a partir de texto. Funciona de una manera muy similar a Stable Diffusion para generar imágenes pero con la sutileza que utiliza un VAE (Variational AutoEncoder) para mapear el audio a su representación latente.

Link 🔗

IA y Salud 💉

Imagen de Google DeepMind

Google DeepMind compartió AlphaMissense: una IA capaz de clasificar si mutaciones genéticas son benignas o dañinas. Este conocimiento es crucial para un diagnóstico más rápido y el desarrollo de tratamientos que salvan vidas.

Por otro lado, Neuralink ha anunciado el inicio de su primer ensayo clínico en humanos. Este estudio representa un paso importante en la misión de Neuralink de crear una interfaz cerebral generalizada usada para restaurar la autonomía de aquellos con necesidades médicas no satisfechas. El objetivo inicial es permitir a las personas controlar un cursor de computadora o un teclado solo con sus pensamientos.

Link 🔗Link 🔗

Nougat: procesamiento de documentos científicos 🍫

Meta AI lanza Nougat (Neural Optical Understanding for Academic Documents), un modelo que realiza tarea de Reconocimiento Óptico de Caracteres (OCR) para procesar documentos científicos en un lenguaje de marcado. Este modelo revoluciona la extracción de texto de imágenes y documentos, ofreciendo una solución más integral y precisa. Es especialmente eficaz en transcribir documentos científicos, abriendo nuevas posibilidades para la accesibilidad del conocimiento.

Link 🔗

Ética en AI

OpenAI dio a conocer las dificultades de GPT-4V(ision), un modelo que integra GPT-4 con la capacidad de analizar imágenes proporcionadas por el usuario. En particular, se analizarón las propiedades de seguridad y ética presentadas y maneras de mitigarlas y evaluarlas.

Link 🔗

--

--