Eine perfekte Illustration mit DALL·E.

Die Kunst des Prompt-Designs: Es liegt an IHNEN.

Vladimir Alexeev
InterMERZ
5 min readJun 2, 2022

--

Eine perfekte Illustration, im Stil von Mucha” (Created by DALL·E)

English version

Täglich erhalte ich Anfragen (da noch nicht jeder einen DALL·E Zugang hat), um Bilder mit bestimmten Prompts zu erstellen. Eine der am häufigsten gestellten Fragen ist die folgende:

F. Kann DALL·E eine Illustration zu einem ganzen Textabsatz erstellen, wenn man diesen Text als PROMPT eingibt?

Meine Antwort sollte lauten (auch wenn es unverschämt klingt):

A. Nee, so geht ein PROMPT nicht.

Aber die Dinge sind immer komplizierter, als sie scheinen.

Sicher, DALL·E wird von Transformern gesteuert, also wird jeder einzelne Teil eines Prompts, den Sie eingeben, vom Modell mit konzentrierter Selbst-Aufmerksamkeit (self-attention) aufgenommen, um ein kohärentes Bild mit innerer Logik zu erschaffen. Manchmal entstehen dabei ungewöhnliche Visionen.

Zum Beispiel für die Strophe aus dem Song Home Sweet Home von Mötley Crüe:

You know that I’ve seen
Too many romantic dreams
Up in lights, falling off the silver screen.

DALL·E hat dieses visuelle Erlebnis kreiert:

Created with DALL·E

Außer “Licht” und “Silber” erkennt man im Bild die Themen aus dem Text nicht wirklich wieder, aber die Stimmung, die Energie, ist da.

Manchmal (oder gar: oft), wenn man den Text einfach nur so kopiert, bekommt man nicht das, was man gerne sehen würde.

Im Fall von “Tragic Kingdom” von No Doubts:

They pay homage to a king,
Whose dreams are buried in their minds,
His tears are frozen stiff,
Icicles drip from his eyes.

Der typische Abschluss besteht aus einer Reihe von “Eiszapfen”, historischen Stätten, antiken Königen und Sehenswürdigkeiten. Optisch beeindruckend, aber nicht wirklich das, was wir erreichen wollen.

In solchen Fällen wird es einem schließlich klar:

Es geht nicht um den Text. Es geht um die Vision. Es geht um das Konzept, das durch die Metaebene schimmert.

In solchen Fällen kann es helfen, auf einen Künstler zurückzugreifen. Wenn man zum Beispiel “Gemälde von Salvador Dalí” eingibt, erhält man eine Vielzahl von Visionen:

Hier sieht man Könige, Eiszapfen und Augen, aber in so surrealen Nebeneinanderstellungen, dass jedes dieser Bilder bereits als perfekte Illustration dienen könnte.

Das Gleiche gilt auch für literarische Werke. Nehmen wir den letzten Absatz aus Hemingways Der alte Mann und das Meer als Prompt:

“Oben auf der Straße, in seiner Hütte, schlief der alte Mann wieder. Er schlief immer noch auf seinem Gesicht, und der Junge saß neben ihm und beobachtete ihn. Der alte Mann träumte von den Löwen”

Doch was wir erhalten, ist eine nette Reihe fotorealistischer Bildern von Löwen. Keine Spur von einem alten Mann oder einem Jungen.

Hat DALL·E hier versagt? Nein. Wir haben versagt. Die Selbstaufmerksamkeit der Maschine ist auf die Löwen gerichtet, den Rest hält sie für irrelevant. Wir müssen DALL·E einen angemessenen PROMPT liefern.

Indem wir also verschiedene Künstler einsetzen und die Prompts ändern (vereinfachen), erhalten wir eine bereits emotional aufgeladene Reihe von Kunstwerken: in unserem Fall von Dalí, J.C. Leyendecker, Magritte und Botticelli:

Created with DALL·E

Für diese Bilder musste ich die PROMPTs anpassen, um alles zusammen zu bekommen.

Wenn wir jetzt verschiedene Prompts ausprobieren, kommen wir unserem Ziel immer näher:

The old man is sleeping, he has dream about lions — and a boy sits near the old man. An illustration by Shaun Tan. (Der alte Mann schläft, er träumt von Löwen — und ein Junge sitzt neben dem alten Mann. Eine Illustration von Shaun Tan.)

Hier vermissen wir noch den Jungen, und manchmal ist es der Löwe, der im Bett schläft. (Shaun Tan, weil er ein großartiger Illustrator ist).

Versuchen wir es mit Norman Rockwell und einer weiteren Prompt-Änderung

Jetzt sehen wir mehr Kohärenz, aber manchmal ist es wieder eine andere Komposition: ein Junge schläft im Bett, ein Löwe sitzt neben ihm.

Wenn wir Künstler=Norman Rockwell und Künstlerische Technik=Ölgemälde ausprobieren, erhalten wir noch bessere Ergebnisse:

The old man is sleeping in bed and having a dream about lions; and a boy sits near the bed of the old man. An oil painting by Norman Rockwell. (Der alte Mann schläft im Bett und träumt von Löwen; und ein Junge sitzt neben dem Bett des alten Mannes. Ein Ölgemälde von Norman Rockwell.)

Wenn wir nun den Künstler in J.C.Leyendecker ändern, erhalten wir rührende, emotion-beladene Bilder:

Oder wir können es mit Jacek Yerka versuchen:

…und plötzlich verschwindet der alte Mann:

Und das ist immer noch nicht das Ende der Reise. Schließlich wäre das anständigste Ergebnis, wenn wir uns von Stiltransfers und der Erwähnung vorhandener Künstler befreien würden — indem wir es einfach mit DALL·E’s eigener kreativer Kapazität (die unendlich ist) schaffen.

Zum Beispiel dies:

Denn jetzt hat man endlich das ganze Bild:

Eine kongeniale Illustration mit Hilfe von DALL·E lässt sich nicht allein durch die Wiederverwendung des Originaltextes als Aufforderung erreichen. Man muss ein proaktiver Künstler werden. Man muss kreativ werden. Man muss eine Vision des Endergebnisses haben. Und Sie müssen Ihre Prompt-Design-Skills einsetzen, um es zu erreichen.

DALL·E bedeutet nicht das Ende der menschlichen Kreativität. Es eröffnet neue Wege für das Narrative. Und für die kreative Zusammenarbeit zwischen Mensch und Maschine.

--

--

Vladimir Alexeev
InterMERZ

Hello friends! I'm a Digital Experience Manager at DB Schenker. Welcome to my non-private account. I'm @merzmensch as well btw. Speaking 🇯🇵 🇩🇪 🇬🇧 🇷🇺