Cosa sono DALLE 2, Midjourney, Craiyon, Imagen e altre IA generative di OpenAI?

Generare buone immagini è difficile, usate https://phraser.tech

Denis Shilov
Phraser
3 min readAug 9, 2022

--

Da qualche tempo l’intelligenza artificiale viene utilizzata per ripristinare fotografie strappate e graffiate e per colorare le immagini in bianco e nero. Ora si sta facendo un altro grande passo avanti: le immagini generate dall’intelligenza artificiale.

Tutte queste immagini sono state create da DALLE 2

Queste immagini sono create da una rete neurale. Per addestrare la rete neurale, le vengono fornite innumerevoli coppie di immagini e relative descrizioni. Dopo l’addestramento, l’IA riconosce un collegamento tra gli oggetti dell’immagine e le parole. Come la maggior parte delle applicazioni dell’apprendimento automatico, le immagini generate dall’IA diventano sempre più utili. Ad esempio, l’AI di DALL-E 2 ha generato un’immagine per la copertina del Cosmopolitan.

Poiché le reti neurali imparano ad associare le immagini alle parole, anche i loro input sono parole. Gli utenti non hanno bisogno di codificare per creare un’immagine. Devono solo scrivere un prompt — una descrizione dell’immagine.

Un esempio di richiesta

È un metodo più semplice, ma ha i suoi limiti. Ad esempio, l’aggiunta di “4k full hd” al prompt aumenta la qualità dell’immagine perché l’intelligenza artificiale associa queste parole a immagini di alta qualità. Questo non è qualcosa che ci si aspetterebbe da una rete neurale, e non c’è modo di saperlo fin dall’inizio.

Le reti neurali più avanzate sono in grado di emulare gli stili di un particolare artista, se si aggiungono parole appropriate al prompt. In questo modo, creano un dipinto alla Degas o una foto come quella di Andy Warhol. Questo funziona anche con gli stili d’arte in generale. Ma dovete comunque riconoscere questi artisti e stili per poter inserire i loro nomi nel prompt.

“Un’immagine di un robot di Salvador Dalì” contro “Un’immagine di un robot di Pablo Picasso”.

Altri aspetti del prompt, come l’ortografia o il livello di dettaglio della descrizione, influenzano l’immagine finale. Tutto può fare la differenza. Ad esempio, se si vuole ottenere una buona foto, si può menzionare “illuminazione in studio” nel prompt. Ma dovete comunque capire tutte queste cose!

Esiste un modo per scrivere prompt migliori: Phraser. È un’applicazione che vi aiuta a scrivere prompt adatti ai vostri scopi e a diverse reti neurali (DALL-E 2, Midjourney, Craiyon, Imagen e così via).

Phraser divide il processo di creazione di un buon prompt in una serie di piccoli passi: scelta del tipo di contenuto, stile, sentimento, epoca, qualità e così via.

Una schermata dell’interfaccia utente di Phraser

Utilizza il metodo ML per consigliare artisti o stili particolari che potrebbero piacervi in base ai vostri gusti personali.

Una schermata dell’interfaccia utente di Phraser

È difficile creare un buon prompt, ma Phraser rende questo processo molto più semplice!

https://phraser.tech

--

--