¿Qué es DALLE 2, Midjourney, Craiyon, Imagen y otras IA generativas de OpenAI?

Generar buenas imágenes es difícil, utiliza https://phraser.tech

Denis Shilov
Phraser
3 min readAug 9, 2022

--

Desde hace un tiempo, la inteligencia artificial se utiliza para restaurar fotografías rotas y rayadas y colorear imágenes en blanco y negro. Ahora se está produciendo otro avance mayor: las imágenes generadas por la IA.

Todas estas imágenes han sido creadas por DALLE 2

Estas imágenes son creadas por una red neuronal. Para entrenar la red neuronal, se le dan innumerables pares de imágenes y sus descripciones. Tras el entrenamiento, la IA reconoce un vínculo entre los objetos de la imagen y las palabras. Como la mayoría de las aplicaciones del aprendizaje automático, las imágenes generadas por la IA son cada vez más útiles. Por ejemplo, la IA de DALL-E 2 ha generado una imagen para la portada del Cosmopolitan.

Como las redes neuronales aprenden a asociar imágenes con palabras, su entrada también son palabras. Los usuarios no necesitan codificar para crear una imagen. Sólo tienen que escribir una indicación, una descripción de la imagen.

Un ejemplo de la indicación

Es una forma más sencilla, pero tiene sus limitaciones. Por ejemplo, si se añade “4k full hd” a la indicación, se mejora la calidad de la imagen porque la IA asocia estas palabras con imágenes de alta calidad. Esto no es algo que se pueda esperar de una red neuronal, y no hay forma de que lo sepa desde el principio.

Las redes neuronales más avanzadas pueden emular los estilos del artista en cuestión, si se añaden las palabras adecuadas a la indicación. De este modo, crea un cuadro a la Degas o una foto como la de Andy Warhol. Esto también funciona con estilos de arte en general. Sin embargo, es necesario que reconozcas a estos artistas y estilos para poder poner sus nombres en la pregunta.

“Un cuadro de un robot de Salvador Dalí” frente a “Un cuadro de un robot de Pablo Picasso”

Otros aspectos del texto, como la ortografía o el nivel de detalle de la descripción, influyen en la imagen final. Todo puede influir. Por ejemplo, si quieres generar una buena foto, puedes mencionar “iluminación de estudio” en el prompt. Pero aún así, ¡tienes que entender todas estas cosas!

Hay una forma de escribir mejores prompts: Phraser. Es una aplicación que te ayuda a escribir prompts adaptados a tus propósitos, así como a diferentes redes neuronales (DALL-E 2, Midjourney, Craiyon, Imagen, etc.).

Phraser divide el proceso de creación de un buen aviso en un conjunto de pequeños pasos: elección del tipo de contenido, estilo, sentimiento, época, calidad, etc.

Una captura de pantalla de la interfaz de usuario de Phraser

Utiliza ML para recomendarte artistas o estilos concretos que podrían gustarte en función de tus gustos personales.

Una captura de pantalla de la interfaz de usuario de Phraser

Es difícil crear una buena frase, pero Phraser hace que este proceso sea mucho más fácil.

https://phraser.tech

--

--