Wat is OpenAI’s DALLE 2, Midjourney, Craiyon, Imagen, en andere generatieve AI?

Goede beelden genereren is moeilijk, gebruik https://phraser.tech

Denis Shilov
Phraser
3 min readAug 9, 2022

--

Sinds enige tijd wordt kunstmatige intelligentie gebruikt om gescheurde en bekraste foto’s te herstellen en zwart-witbeelden in te kleuren. Een andere, grotere stap voorwaarts is nu aan de gang, AI-gegenereerde beelden.

Al deze beelden zijn gemaakt door DALLE 2

Deze beelden worden gecreëerd door een neuraal netwerk. Om het neurale netwerk te trainen, worden ontelbare paren afbeeldingen en hun beschrijvingen aan het netwerk gegeven. Na de training herkent AI een verband tussen de objecten in de afbeelding en de woorden. Zoals de meeste toepassingen van machinaal leren, worden door AI gegenereerde beelden steeds nuttiger. Zo heeft DALL-E 2 AI een afbeelding gegenereerd voor de cover van de Cosmopolitan.

Aangezien neurale netwerken leren om beelden met woorden te associëren, is hun input ook woorden. Gebruikers hoeven niet te coderen om een afbeelding te maken. Zij hoeven alleen maar een prompt te schrijven — een beschrijving van het beeld.

Een voorbeeld van de prompt

Dit is een eenvoudigere manier, maar het heeft zijn beperkingen. Door bijvoorbeeld ‘4k full hd’ aan de prompt toe te voegen, wordt de kwaliteit van de afbeelding verhoogd, omdat AI deze woorden associeert met afbeeldingen van hoge kwaliteit. Dit is niet iets wat je zou verwachten van een neuraal netwerk, en er is geen manier waarop je dat meteen vanaf het begin zou weten.

Geavanceerde neurale netwerken kunnen de stijl van een bepaalde kunstenaar emuleren — als je de juiste woorden aan de prompt toevoegt. Op die manier creëert het een schilderij a la Degas of een foto zoals die van Andy Warhol. Dit werkt ook met kunststijlen in het algemeen. Maar je moet deze kunstenaars en stijlen nog steeds herkennen om hun namen in de prompt te kunnen zetten.

“Een schilderij van een robot door Salvador Dali” vs “Een schilderij van een robot door Pablo Picasso”

Andere aspecten van de opdracht, zoals de spelling of de mate van detail in de beschrijving, beïnvloeden het uiteindelijke beeld. Alles kan een verschil maken. Als je bijvoorbeeld een goede foto wilt genereren, zou je ‘studioverlichting’ in de prompt kunnen vermelden. Maar je moet al deze dingen nog steeds begrijpen!

Er is een manier om betere prompts te schrijven — Phraser. Het is een app die je helpt om prompts te schrijven die aangepast zijn aan jouw doeleinden en aan verschillende neurale netwerken (DALL-E 2, Midjourney, Craiyon, Imagen, enzovoort).

Phraser verdeelt het proces van het maken van een goede prompt in een aantal kleine stappen — keuze van het type inhoud, stijl, gevoel, tijdperk, kwaliteit, enzovoort.

Een screenshot van Phraser UI

Het gebruikt ML om u bepaalde artiesten of stijlen aan te bevelen die u zouden kunnen bevallen, gebaseerd op uw persoonlijke smaak.

Een screenshot van Phraser UI

Het is moeilijk om een goede prompt te maken, maar Phraser maakt dit proces veel gemakkelijker!

https://phraser.tech

--

--