BigGAN als ein kreativer Motor

Vladimir Alexeev
InterMERZ
Published in
5 min readNov 18, 2021

English version

WWahrlich, das Jahr 2018 kann als der Beginn der wirklichen kreativen Entiwcklung von Künstlicher Intelligenz bezeichnet werden. Sicher, die ganze Geschichte begann schon früher, Google Deep Dream war auch bereits eine Fortsetzung der menschlichen Versuche, eine Maschine für die Kunst zu einzusetzen.

Mit der Entwicklung von #KI wurde die Kunstgenese durch die digitalen Entitäten zu einer völlig neuen Form — in einem Zwischenzustand zwischen Autor und Werkzeug.

Die Versuche, Künstliche Intelligenz in der Kunstwelt zu nutzen, wurden im Sommer 2018 kontrovers diskutiert, als ein Künstlerkollektiv namens Obvious ein KI-generiertes Werk bei Christie’s verkaufte (nicht ohne Urheberrechtsfragen).

2018 machte auch BigGAN (GAN = Generative Adversarial Networks) populär. Schauen wir uns diese vielversprechende Entwicklung einmal genauer an.

Forscher, Programmierer, Künstler arbeiten auf der Grundlage von Deep Learning mit TensorFlow (Open-Source-Softwarebibliothek für Datenflussprogrammierung von Google, praktisch einsetzbar für Deep Learning) und versuchen, die Neuronalen Netze das Weltbild der Künstlichen Intelligenz visualisieren zu lassen.

Das Beste Nachricht für alle Nicht-Programmierer unter uns: Google bietet mit Collaborative Research eine kostenlose interaktive Möglichkeit für jeden, BigGAN (und so gut wie alle anderen möglichen KI-Modelle) auszuprobieren und zu experimentieren. Ohne Python-Kenntnisse (aber umso hilfreich, falls vorhanden), ohne Monster-PCs an der Hand (es werden Google-GPUs eingesetzt).

In meiner Serie “KI & Kreatität” möchte ich mit Ihnen die neuesten Tendenzen beobachten, neue Tools ausprobieren und die #KI-Künstler vorstellen.

Zugegebenerweise, auch ich habe einen gewissen Nachholbedarf, da sich die Dinge so rasant entwickeln. Es gibt noch eine Menge zu zeigen! Und fast täglich werden die sogenannten Colab Notebooks veröffentlicht — welche es jedem erlauben, KI Methoden auszuprobieren.

Heute: BigGAN als #KI-Bildgenerator

Sicherlich können Sie TensorFlow und andere Komponenten auf Ihrem lokalen Rechner/Server installieren (dazu brauche Sie Know-how, Programmierkenntnisse, stabiles und mächtiges Hardware). Doch es gibt auch ein Notebook, auf dem man mit dem System herumspielen kann, auch wenn man kein #KI-Experte ist.

Hier ist das grundlegende BigGAN TensorFlow Notebook, mit dem Sie beginnen können.

Die Benutzung ist einfach:

  • Starten Sie jede Zelle, indem Sie auf das [>]-Zeichen klicken.
  • Testen Sie die Standardeinstellungen.
  • Probieren Sie aus, was Sie wollen (keine Sorge, Sie werden das Internet nicht kaputt machen).

Im Dropdown-Menü “Category” finden Sie eine Vielzahl von Motiven und Objekten, die mit BigGAN erzeugt werden können.

Versuchen wir es mit der Kategorie “979) Valley, vale” (Tal).

num_samples bestimmt die Anzahl der Beispiele
truncation steuert die Intensität der Unterschiede zwischen den Bildern
noise_seed verändert die Variable, anhand welcher die Bilder entstehen.

Hier ist, was BigGAN unter “Valley” versteht:

979) Valley

Nicht schlecht. Abgesehen von einigen seltsamen Artefakten könnte man glauben, es handele sich um eine existierende Landschaft, mit einer Fotokamera eingefangen.

Das System wurde auf riesigen Mengen von beschrifteten visuellen Daten trainiert — also auch auf einer großen Auswahl von Naturfotos. Die obigen Bilder sehen fotorealistisch aus, auch wenn sie vollständig von Deep Learned neuronalen Netzen erzeugt wurden.

Aber auch unser Gehirn spielt da mit — indem die seltsame Glitsches und Erscheinungen auf den ersten Blick nicht auffallen.

Lassen Sie uns also tiefer graben.

409) Analog clock (Analoge Uhr)

409) Analog clock

Schon hier scheitert das System an Details. Wir können buchstäblich sehen, wie es versucht, seine Vorstellung von dem gesuchten Objekt zu vermitteln: “rundlich”, “mit Zeiger”, “mit Zahlen”. Es ahmt nacht, simuliert aber nicht, denn im Falle einer Simulation würden die Zahlen korrekt dargestellt werden.

Es gibt deutliche Parallelen zwischen den Versuchen der KI, die Welt zu interpretieren, und der Ideenleere von Platon:

Ideen oder Formen waren hiernach meta-physische Essenzen der materiellen Dinge. Die materiellen Dinge waren keine Originale, sondern nur Nachahmungen (Mimesis) der Ideen/Formen.

In diesem Fall sind also die Objekte, die wir Menschen kennen, und die Visionen von erkannten Konzepte durch die KI gleichwertig. Sie sind nur verschiedene Versuche, diese Ideen zu vermitteln. Was denken Sie darüber?

549) Envelope (Briefumschlag)

549) Envelope

Nun, die Ergebnisse sehen eher wie eine Zeichnung oder eine Postkarte aus als ein Umschlag. (Wahrscheinlich gab es Komplikationen bei der Beschriftung des Original-Datasets durch den Menschen). Doch hier sehen wir, wie die KI versucht, die menschliche Kreativität darzustellen. Schriftzüge. Kritzeleien. Texte, die wir für eine Sekunde als Text erkennen können, und doch im nächsten Moment entgleiten sie unserer Wahrnehmung wie ein Buchtitel aus einem Traum kurz nach dem Aufwachen. Unser Gehirn arbeitet intensiv daran, die Vision zu begreifen.

Und so lassen wir doch unser Gehirn noch mehr verwirren.

917) Comic Book

917) Comic book

Sie sehen deutlich die Topoi eines Comics: Superheldenfiguren (farblich an Superman angelehnt), große Buchstaben auf dem Cover. Ein Comic-Laden (allerdings ein ziemlich verwüsteter). Eine Wand mit Comic-Postern darauf.

Dies ist nicht nur eine Simulation dessen, wie Comics aussehen sollten. Es ist ein klarer Versuch einer künstlichen Intelligenz, das Verständnis für die Idee und Form der Entität “Comic” zu visualisieren. Nennen Sie mich esoterisch, wenn Sie wollen, aber ich sehe hier weit mehr als nur ein Produkt aus Bites und Bytes.

Es ist ein Drang, die Welt da draußen zu verstehen.

Das BigGAN-Basistool ermöglicht noch eine weitere Verrücktheit, aber das sehen wir uns in unserem nächsten Beitrag an.

Bis bald!

Veröffenticht: 18. Dezember 2018 in Data Driven Investor

--

--

Vladimir Alexeev
InterMERZ

Hello friends! I'm a Digital Experience Manager at DB Schenker. Welcome to my non-private account. I'm @merzmensch as well btw. Speaking 🇯🇵 🇩🇪 🇬🇧 🇷🇺