Qu’est-ce que DALLE 2, Midjourney, Craiyon, Imagen et autres IA génératives d’OpenAI ?

Il est difficile de générer de bonnes images, utilisez https://phraser.tech

Denis Shilov
Phraser
3 min readAug 9, 2022

--

Depuis un certain temps déjà, l’intelligence artificielle est utilisée pour restaurer les photographies déchirées et rayées et coloriser les images en noir et blanc. Une autre avancée plus importante est en train de se produire, celle des images générées par l’IA.

Toutes ces images sont créées par DALLE 2

Ces images sont créées par un réseau neuronal. Pour entraîner le réseau neuronal, d’innombrables paires d’images et leurs descriptions lui sont données. Après l’entraînement, l’IA reconnaît un lien entre les objets de l’image et les mots. Comme la plupart des applications de l’apprentissage automatique, les images générées par l’IA sont de plus en plus utiles. Par exemple, l’IA de DALL-E 2 a généré une image pour la couverture du Cosmopolitan.

Étant donné que les réseaux neuronaux apprennent à associer des images à des mots, leur entrée est également constituée de mots. Les utilisateurs n’ont pas besoin de coder pour créer une image. Il leur suffit d’écrire une invite — une description de l’image.

Un exemple de l’invite

C’est une méthode plus simple, mais elle a ses limites. Par exemple, l’ajout de “4k full hd” à l’invite améliore la qualité de l’image car l’IA associe ces mots à des images de haute qualité. Ce n’est pas quelque chose que vous attendez d’un réseau neuronal, et il n’y a aucun moyen de le savoir dès le départ.

Les réseaux neuronaux de pointe peuvent émuler le style d’un artiste particulier — si vous ajoutez les mots appropriés à l’invite. Ainsi, il crée une peinture à la Degas ou une photo comme celle d’Andy Warhol. Cela fonctionne également avec les styles d’art en général. Mais vous devez tout de même reconnaître ces artistes et ces styles pour être en mesure d’inscrire leurs noms dans l’invite.

“Une photo de robot de Salvador Dali” contre “Une photo de robot de Pablo Picasso”.

D’autres aspects du sujet, comme l’orthographe ou le niveau de détail de la description, influencent l’image finale. Tout peut faire la différence. Par exemple, si vous souhaitez produire une bonne photo, vous pouvez mentionner “éclairage de studio” dans l’invite. Mais vous devez quand même comprendre tous ces éléments !

Il existe un moyen de rédiger de meilleurs prompts : Phraser. Il s’agit d’une application qui vous aide à rédiger des invites adaptées à vos besoins ainsi qu’aux différents réseaux neuronaux (DALL-E 2, Midjourney, Craiyon, Imagen, etc.).

Phraser divise le processus de création d’une bonne invite en une série de petites étapes — choix du type de contenu, style, sentiment, époque, qualité, etc.

Une capture d’écran de l’interface utilisateur de Phraser

Il utilise ML pour vous recommander des artistes ou des styles particuliers que vous pourriez aimer en fonction de vos goûts personnels.

Une capture d’écran de l’interface utilisateur de Phraser

Il est difficile de créer une bonne invite, mais Phraser rend ce processus beaucoup plus facile !

https://phraser.tech

--

--