Prompt-Design für DALL·E 2: Serie

Index

Vladimir Alexeev
InterMERZ
3 min readJun 11, 2022

--

Created with DALL·E 2

English Version

Eines wurde klar, als GPT-3 veröffentlicht wurde: Prompt Design ist alles. GPT-3 als ein Sprachmodell benötigte einen besonderen Ansatz. Es war eine Kommunikation zwischen Mensch und KI. Sie brauchen einen Text — Sie müssen die KI inspirieren. Weder erzwingen noch auffordern — sondern inspirieren, das Transformer-gesteuerte Modell orientieren und auf den richtigen Weg vorbereiten. Man musste mit der generativen Psychologie der Maschine vertraut sein, wenn man die angestrebten Ergebnisse erzielen wollte.

Promptes Design ist alles.

Eine weitere Offenbarung wurde bald Wirklichkeit: Prompt Designer ist ein neues Berufsfeld, eine neue Profession im Zeitalter der Mensch-Maschine-Kollaboration. Eine transformative Arbeit zwischen Technologie, Geisteswissenschaften und Kunst.

Mit DALL·E verstehen wir diese Bedeutung nicht nur. Wir SEHEN sie. Kurz nachdem OpenAI CLIP im Winter 2021 veröffentlicht hatte, tauchten überall viele CLIP-basierte Colab Notebooks auf (dank Advadnoun und anderer brillanter Forscher und Künstler). Sie entdeckten spezifische Modifiers und Prompt-Elemente, die die Bilderzeugung beeinflussten.

Nota Bene:Ein richtiger Prompt besteht mindestens aus zwei Teilen:
Inhalt und Modifikator (Modifier).
* Der Inhalt beschreibt die Motive, die Sie von dem KI-Modell erhalten möchten.
* Modifikator steuert die visuellen Merkmale, den Charakter, die “Stimmung” des Bildes.
Zum Beispiel: “Ein roter Apfel in einer Hand, Lomographie, schwarz-weiß”Ein roter Apfel in einer Hand ist Inhalt
Lomographie, schwarz-weiß ist Modifikator
Aber alles wird in einem Prompt geschrieben - KI versteht die Parameter.

Beispiele für Modifikatoren:

“trending on Artstation” macht ein Bild “trendiger”, “Zeitgeist”-mässig, weniger “amateurhaft” (in Bezug auf Kunst ist es natürlich eine unendliche Diskussion über die Ästhetik). Die Stimmung der besten Bilder, die auf ArtStation im Trend liegen.

Der Zusatz “Unreal Engine” zu dem PROMPT machte die visuelle Umsetzung dimensionaler und frischer.

Wenn man den Namen eines Künstlers hinzufügt, entsteht ein “Stiltransfer”, und das generierte Bild tendiert zum Stil und zur Essenz des genannten Künstlers.

Sie können die Modifikationen auch kombinieren, um etwas Besonderes zu erhalten. Zum Beispiel: “Cat’s restaurant, in da Vinci style, trending on artstation” hat für mich in Disco Diffusion dieses Meisterwerk geschaffen:

Oder “Photorealistic Museum Hall, Unreal Engine” erstellt semi-rendered Vision:

Es gibt viele hervorragende Kompilationen mit solchen Modifikatoren, wie sie Unlimited Dream Co für den VQGAN+CLIP-Ansatz beschrieben hat:

Dabei ist zu beachten, dass solche Modifikatoren für jedes Modell, das auf einem bestimmten beschriebenen und aufbereiteten Datensatz trainiert wurde, unterschiedlich sind. VQGAN hat seine eigenen, Midjourney, Disco Diffusion, Pytti, Imagen etc. haben ihr eigenes Wissen.

In meiner Serie Prompt Design for DALL·E möchte ich mich speziell auf dieses Modell konzentrieren, das wir im offiziellen DALL·E Discord Channel erforschen.

Dies wird eine Sammlung von Artikeln mit Listen und Beispielen für solche Modifikatoren sein, mit ständig aktualisierten Informationen.

Denn wir kratzen immer noch nur an der Oberfläche der Künstlichen Kreativität.

Created with DALL·E 2

--

--

Vladimir Alexeev
InterMERZ

Hello friends! I'm a Digital Experience Manager at DB Schenker. Welcome to my non-private account. I'm @merzmensch as well btw. Speaking 🇯🇵 🇩🇪 🇬🇧 🇷🇺