MidJourney V4 — Kitsch oder Kunst?

Mit Prompts und Beispielen

Vladimir Alexeev
InterMERZ

--

Die Evolution (oder gar: Revolution?) der generativen KI geht weiter. 2021 veröffentlichte OpenAI CLIP als OpenSource. Aus meiner Sicht war dies der Beginn der KI-Kunstrevolution: man begann, CLIP zu erforschen und mit VQGAN, StyleGAN usw. zu kombinieren.

Später, im Jahr 2021, folgten DiscoDiffusion, Pytti und andere faszinierende KI-Modelle.

Dann, im Jahr 2022 — Discord-basierte MidJourney wurde im März 2022 veröffentlicht — DALL-E 2, später #StableDiffusion.

Und wir sind immer noch am Anfang.

MidJourney erregte meine Aufmerksamkeit, nachdem ich überall beeindruckende Bilder auftauchen sah. Dieses auf Discord basierende Modell wurde in drei Versionen veröffentlicht, von denen jede ihre eigene Ästhetik innehatte, wenn man sie ohne viele Modifikatoren aufforderte.

Prompt: “Eierlegende Wollmilchsau” (Merzmensch).

Ich war dieser Ästhetik nicht abgeneigt, wurde ihr aber nach einer Flut generischer Generationen überdrüssig. Zu perfekt, zu illustrativ und doch nach einer Weile nichts Neues mehr. Die meisten Gesichter sahen auf diese Weise aus (generisch schön):

Prompt: SEPLASIATOR (Merzmensch)

Die leuchtenden Farben wurden zum Klischee. Aber auch Motive wie sich dem Betrachter den Rücken zuwendenden Personen, jugendstilähnliche Portale in eine andere Dimension, rundliche Strukturen. Ja, ich mochte diese Ästhetik, doch wurde sie zu repetitiv. Auch PERFEKT.

Aufforderung: Gescheiterter Künstler (Merzmensch)

Selbst das berühmte Werk “Théâtre D’opéra Spatial” von Jason Allen, das auf der Colorado State Fair den ersten Platz in der digitalen Kategorie gewann, kam mir sehr bekannt vor, wenn man genug mit MidJourney gearbeitet hat.

“Théâtre D’opéra Spatial,” von Jason Allen (Quelle)

Natürlich kann man durch den Einsatz von Modifikatoren einen noch einzigartigeren Look bis hin zum Fotorealismus erzeugen:

“Ein Mädchen schaut aus dem Zugfenster, Schwarz-Weiß-Fotografie”

Midjourney wird immerwährend entwickelt, sein Discord-Kanal zählt 4 Millionen Nutzer, und die MJ-Entwickler arbeiten ständig an neuen Updates.

Also kam “-- test”, und dann der weiterhin verfeinernde “--creative” Parameter.

Prompt: portrait of a man questioning his reality, by Thomas Rondolfasi — test — creative (Merzmensch)

Nach einer Weile wurde --testp für mehr Fotorealismus eingeführt:

Die Serie “Kunst in der Kunst in der Kunst” wurde mit dem Parameter testp erstellt. Man sieht einen Reichtum an Details und Motiven — das war definitiv ein großer Schritt vorwärts zum immersiven Maschinentraum.

“Japanischer Künstler mit seinen Kunstwerken in seinem Atelier, Fotografie 14mm Objektiv — testp — “

MidJourney V4 — zu viel des Guten?

Kürzlich wurde die neueste Version von MidJourney veröffentlicht. Sie ist wundervoll und problematisch zur gleichen Zeit.

V4 präsentiert ein einfaches Spiel — und es ist auch zu viel. Die nativen Vervollständigungen (MidJourney Aufforderungen ohne test und testp) erledigen die gesamte Arbeit für den Künstler. Zum Beispiel die folgenden Bilder, die wir in den Versionen 1–3 mit dem Prompt erhalten

Mädchen mit einem Roboter im futuristischen Paris, von J.C.Leyendecker
“Mädchen mit einem Roboter im futuristischen Paris, von J.C.Leyendecker” in den Versionen 1–3

Und hier ist, was Version 4 schöpft:

Visuell atemberaubend, eine Comic-Mischung aus Leyendecker, Schuiten und anderen visionären Künstlern — mit Architektur, Technologie und schönen Gesichtern. Wir sehen so viele Details und Designs im Vergleich zu V1–3.

Oder ein anderes Beispiel:

Seltsamer Traum

Ja, genau diese minimalistische Aufforderung. Die Erfahrung zeigt, dass diese Zero-Shot-Prompts dem Transformer-Netzwerk erlaubt, neue Geschichten zu erzählen.

Versionen 1–3:

Wir sehen die vertrauten Farbpaletten, Strukturen, Vignetten als kompositorische Rahmung. Aber bei Version 4 bekommen wir das hier:

Für den einen oder anderen mag das atemberaubend und faszinierend sein. Ich sehe diese inhaltliche Überfrachtung eher kritisch. Diese Bildsprache sieht aus wie photoshop-surreale DOCMA-Kunst aus den 2000er Jahren. Und um ehrlich zu sein, für mich sieht es kitschig aus.

Als ob ein Künstler versuchen würde, eine innere Welt zu vermitteln, aber das “es ist nicht genug”-Gefühl frisst die Seele des Künstlers auf. Und so wird, um den Schaffensdrang besser auszudrücken, hier ein Detail hinzugefügt, dort ein weiteres. Das verfehlt den Sinn. Um dem Publikum zu dienen oder die Ideen besser zu vermitteln, wird das Werk verzerrt und wird zu Pulp Fiction und Kolportage.

Das ist nur meine persönliche Meinung.

Auch mit einem minimalistischen Prompt erhalten wir wunderschöne/kitschige/verblüffende/überladene Bilder (Geschmackssache).

Wir können sogar mit Emojis auffordern. Zum Beispiel mit diesem:

Und hier ist, was V4 erzeugt (hier: vier verschiedene Variationen)

Ich sage nicht, dass es furchtbar ist, sie sind interessant, nur:

Wir brauchen unbedingt einen neuen künstlerischen Ansatz bei V4.

Sonst wird hier der völlig grundlose, aber verfestigte Stereotyp “click2art” nur untermauert.

Und wir KI-Künstler wissen sehr gut, dass KI-Kunst DEFINITIV MEHR ist, als nur auf “generieren” zu klicken oder ein paar Einstellungen zu ändern. Es ist harte Arbeit, eine wilde Mischung aus Inspiration und Transpiration, Tage, Wochen des Schaffens des perfekten Ausdrucks deines Inneren.

Midjourney als Werkzeug unterstützt die Vielfalt und Ideengebung mit interessanten Funktionen, von denen viele bereits aus früheren Versionen bekannt sind. Nur hier sind sie perfektioniert. Zum Beispiel,

— chaos <Wert 0–100>

Das schafft ganz unterschiedliche Variationen einer Vision.

Zum Beispiel eine andere Emoji-Aufforderung. Emoji eines Elefanten.

Die überladene V4 erzeugt dies:

Ein weiteres trashiges Airbrush-ähnliches Bild, bei dem der Elefant neben einer Frau und einem Schmetterling steht (kitschiger Albtraum). Nun, um bei der Wahrheit zu bleiben, die anderen 3 Versionen zeigen einen soliden Elefanten.

Aber wenn man einen Chaoswert von 100 hinzufügt, erhält man eine Diversität an Motive, eines davon ist eine nette Kinderbuchillustration:

Aber ich will mich nicht beschweren, denn ich bin beeindruckt von den kreativen Fähigkeiten der KI.

Sie hat ein neues, verblüffendes Niveau des Narrativen erreicht. Details, Ideen, Momente.

Alter Mann, der aus dem Fenster auf die Leute schaut, die die Straße auf und ab gehen

Diese einsame Pose, die Tiefenschärfe, die dunkle Menschengestalten, die europäische Architektur, der Kamerawinkel — alles erzählt eine Geschichte. MidJourney kann uns helfen, Sujets zu entwickeln, von unserer verengten Fantasie zu abstrahieren und sie aus einer völlig anderen Perspektive zu betrachten.

Manchmal ist es kitschig, ja, aber auf eine perfekte Weise.

FUN FACT: Wenn MidJourney den Prompt nicht versteht (wenn es, sagen wir mal, Kauderwelsch ist), erstellt es Mädchenportraits… (bei DALL-E waren es Naturbilder, bei MidJourney V1–3 expressionistische Landschaftsmalerei)

Gesichtszüge, Stadtteile, alles ist vorbereitet. Ein Werkzeug für faule Künstler? Weitaus mehr als nur das. Ich habe es nicht im Sinn, mich über Version 4 zu beschweren.

Kreative Tumulte mit MidJourney

Die wilde Phantasie von V4 schafft erstaunliche Illustrationen — oder gibt großartige Ideen zur Illustration:

Keineswegs ein Ersatz. Vielmehr: Unterstützung, Ideengeber, Brainstorming — KI schlägt interessante Kompositionen vor, die vom Designer berücksichtigt werden können — müssen aber nicht. KI stellt keineswegs eine Gefahr der Kreativen dar — es ist eher eine kreative Erweiterung für sie.

MidJourney versteht die Prompts ziemlich gut:

Ein Buch mit einer ganzen Welt, die aus dem Buch herauskommt

Oder:

Dystopischer Elefant

Das Modell fängt das “Gefühl” und die inhaltliche Ausrichtung aus dem Prompt ein und setzt es visuell um.

Verschwörungstheoretiker

Hier finden sich Details und Topoi von Verschwörungserzählungen: Pyramiden, Außerirdische, Geheimbünde.

Auch die stilistischen Möglichkeiten sind ziemlich stark:

Old Middle-Age manuscript of people using smartphones and iPhones

Schließlich ist der Surrealismus in dieser Version wahrscheinlich der vorherrschende Stil:

Typewriter with teeth instead of buttons

Was ist mit Ihnen, Souffleusen? Traut ihr euch?

Die Erkundung von V4 nach rund 2 Wochen liefert so viele interessante Entdeckungen — und es geht weiter! In meinen nächsten Essays werden wir mehr Verrücktheiten sehen.

Benutzen Sie auch MidJourney? Teilen Sie Ihre Erkenntnisse und Kunstwerke mit uns!

--

--

Vladimir Alexeev
InterMERZ

Hello friends! I'm a Digital Experience Manager at DB Schenker. Welcome to my non-private account. I'm @merzmensch as well btw. Speaking 🇯🇵 🇩🇪 🇬🇧 🇷🇺