Was ist OpenAIs DALLE 2, Midjourney, Craiyon, Imagen und andere generative KI?

Gute Bilder zu erzeugen ist schwierig, verwenden Sie https://phraser.tech

Denis Shilov
Phraser
3 min readAug 9, 2022

--

Schon seit einiger Zeit wird künstliche Intelligenz eingesetzt, um zerrissene und zerkratzte Fotos zu restaurieren und Schwarz-Weiß-Bilder zu kolorieren. Ein weiterer, größerer Schritt nach vorn ist nun die KI-generierte Bilder.

Alle diese Bilder wurden von DALLE 2 erstellt.

Diese Bilder werden von einem neuronalen Netz erzeugt. Um das neuronale Netz zu trainieren, werden ihm unzählige Bildpaare und deren Beschreibungen vorgelegt. Nach dem Training erkennt die KI eine Verbindung zwischen den Objekten auf dem Bild und den Wörtern. Wie die meisten Anwendungen des maschinellen Lernens werden auch die von der KI erzeugten Bilder immer nützlicher. Zum Beispiel hat die KI von DALL-E 2 ein Bild für das Cover der Cosmopolitan erstellt.

Da neuronale Netze lernen, Bilder mit Wörtern zu verknüpfen, sind auch ihre Eingaben Wörter. Die Benutzer müssen nicht programmieren, um ein Bild zu erstellen. Sie müssen lediglich eine Aufforderung schreiben — eine Beschreibung des Bildes.

Ein Beispiel für eine Aufforderung

Dies ist eine einfachere Methode, die jedoch ihre Grenzen hat. Wenn man z. B. “4k full hd” zur Eingabeaufforderung hinzufügt, wird die Qualität des Bildes verbessert, weil die KI diese Wörter mit hochwertigen Bildern assoziiert. Das ist nichts, was man von einem neuronalen Netz erwarten würde, und es gibt keine Möglichkeit, das von vornherein zu wissen.

Moderne neuronale Netze können den Stil des jeweiligen Künstlers nachahmen — wenn Sie der Eingabeaufforderung entsprechende Wörter hinzufügen. Auf diese Weise entsteht ein Gemälde a la Degas oder ein Foto wie das von Andy Warhol. Das funktioniert auch mit Kunststilen im Allgemeinen. Sie müssen diese Künstler und Stile jedoch kennen, um ihre Namen in die Aufforderung einfügen zu können.

“Ein Bild eines Roboters von Salvador Dali” vs. “Ein Bild eines Roboters von Pablo Picasso”

Andere Aspekte der Aufforderung, wie die Rechtschreibung oder der Detailgrad der Beschreibung, beeinflussen das endgültige Bild. Alles kann einen Unterschied machen. Wenn Sie zum Beispiel ein gutes Foto machen wollen, könnten Sie in der Aufforderung “Studiobeleuchtung” erwähnen. Aber Sie müssen all diese Dinge trotzdem verstehen!

Es gibt eine Möglichkeit, bessere Prompts zu schreiben — Phraser. Es ist eine App, die dir hilft, Prompts zu schreiben, die sowohl für deine Zwecke als auch für verschiedene neuronale Netze (DALL-E 2, Midjourney, Craiyon, Imagen und so weiter) geeignet sind.

Phraser unterteilt den Prozess der Erstellung eines guten Prompts in eine Reihe von kleinen Schritten — Wahl des Inhaltstyps, des Stils, des Gefühls, der Epoche, der Qualität, und so weiter.

Ein Bildschirmfoto von Phraser UI

Phraser verwendet ML, um Ihnen bestimmte Künstler oder Stile zu empfehlen, die Sie aufgrund Ihres persönlichen Geschmacks mögen könnten.

Ein Bildschirmfoto von Phraser UI

Es ist schwer, einen guten Prompt zu erstellen, aber Phraser macht diesen Prozess viel einfacher!

https://phraser.tech

--

--