Vad är OpenAI:s DALLE 2, Midjourney, Craiyon, Imagen och annan generativ AI?

Det är svårt att skapa bra bilder, använd https://phraser.tech

Denis Shilov
Phraser
3 min readAug 9, 2022

--

Under en tid har artificiell intelligens använts för att återställa sönderrivna och repade fotografier och färglägga svartvita bilder. Ett annat, större steg framåt sker nu, AI-genererade bilder.

Alla dessa bilder har skapats av DALLE 2

Dessa bilder skapas av ett neuralt nätverk. För att träna det neurala nätverket får det otaliga par av bilder och deras beskrivningar. Efter träningen känner AI igen en koppling mellan objekten i bilden och orden. Liksom de flesta tillämpningar av maskininlärning blir AI-genererade bilder mer och mer användbara. DALL-E 2 AI har till exempel genererat en bild för omslaget till Cosmopolitan.

Eftersom neurala nätverk lär sig att associera bilder med ord, så kommer deras inmatade ord också att göra det. Användarna behöver inte koda för att skapa en bild. De behöver bara skriva en uppmaning — en beskrivning av bilden.

Ett exempel på en uppmaning

Detta är ett enklare sätt, men det har sina begränsningar. Om man till exempel lägger till “4k full HD” i uppmaningen ökar bildens kvalitet eftersom AI associerar dessa ord med högkvalitativa bilder. Detta är inte något som man förväntar sig av ett neuralt nätverk, och det finns inget sätt att veta det redan från början.

De senaste neurala nätverken kan efterlikna en viss konstnärs stil — om du lägger till lämpliga ord i uppmaningen. På så sätt skapar det en målning a la Degas eller ett foto som Andy Warhols. Detta fungerar också med konststilar i allmänhet. Men du måste ändå känna igen dessa konstnärer och stilar för att kunna sätta in deras namn i uppmaningen.

“En bild av en robot av Salvador Dali” vs “En bild av en robot av Pablo Picasso”

Andra aspekter av uppmaningen, som stavning eller detaljnivå i beskrivningen, påverkar den slutliga bilden. Allt kan göra skillnad. Om du till exempel vill generera ett bra foto kan du nämna “studiobelysning” i uppmaningen. Men du måste ändå förstå alla dessa saker!

Det finns ett sätt att skriva bättre uppmaningar — Phraser. Det är en app som hjälper dig att skriva prompts som är anpassade för dina syften samt för olika neurala nätverk (DALL-E 2, Midjourney, Craiyon, Imagen och så vidare).

Phraser delar upp processen att skapa en bra uppmaning i en rad små steg — val av innehållstyp, stil, känsla, epok, kvalitet och så vidare.

En skärmdump av Phraser UI

Den använder ML för att rekommendera dig särskilda artister eller stilar som du kanske gillar utifrån din personliga smak.

En skärmdump av Phraser UI

Det är svårt att skapa en bra uppmaning, men Phraser gör denna process mycket enklare!

https://phraser.tech

--

--