Co je DALLE 2, Midjourney, Craiyon, Imagen a další generativní umělá inteligence?

Generování dobrých snímků je obtížné, použijte https://phraser.tech

Denis Shilov
Phraser
3 min readAug 9, 2022

--

Umělá inteligence se již nějakou dobu používá k obnově roztrhaných a poškrábaných fotografií a k obarvení černobílých snímků. Nyní dochází k dalšímu, většímu posunu vpřed, a to v oblasti obrázků generovaných umělou inteligencí.

Všechny tyto obrázky jsou vytvořeny programem DALLE 2

Tyto snímky jsou vytvářeny neuronovou sítí. K trénování neuronové sítě je jí zadáno nespočet dvojic obrázků a jejich popisů. Po tréninku AI rozpozná souvislost mezi objekty na obrázku a slovy. Stejně jako většina aplikací strojového učení jsou i obrázky generované umělou inteligencí stále užitečnější. Například umělá inteligence DALL-E 2 vygenerovala obrázek pro obálku časopisu Cosmopolitan.

Protože se neuronové sítě učí přiřazovat obrázky ke slovům, jejich vstupní slova také. Uživatelé nemusí kódovat, aby vytvořili obrázek. Stačí, když napíší výzvu — popis obrázku.

Příklad výzvy

Je to jednodušší způsob, ale má svá omezení. Například přidání slova “4k full HD” do výzvy zvyšuje kvalitu obrázku, protože umělá inteligence si tato slova spojuje s vysoce kvalitními obrázky. To není něco, co byste od neuronové sítě očekávali, a není možné, abyste to věděli hned na začátku.

Nejmodernější neuronové sítě dokážou napodobit styl konkrétního umělce — pokud do výzvy přidáte vhodná slova. Tímto způsobem vytvoří obraz a la Degas nebo fotografii jako Andy Warhol. Funguje to i se styly umění obecně. Stále však musíte tyto umělce a styly rozpoznat, abyste mohli do výzvy zapsat jejich jména.

“Obraz robota od Salvadora Dalího” vs. “Obraz robota od Pabla Picassa”

Další aspekty výzvy, jako je pravopis nebo úroveň detailů v popisu, ovlivňují výsledný obrázek. Cokoli může mít vliv. Pokud například budete chtít vytvořit dobrou fotografii, můžete v zadání uvést “studiové osvětlení”. Ale i tak musíte všem těmto věcem rozumět!

Existuje způsob, jak psát lepší podněty — Phraser. Je to aplikace, která vám pomůže psát podněty přizpůsobené vašim účelům i různým neuronovým sítím (DALL-E 2, Midjourney, Craiyon, Imagen atd.).

Phraser rozděluje proces tvorby dobré výzvy na řadu malých kroků — výběr typu obsahu, stylu, pocitu, epochy, kvality atd.

Snímek obrazovky uživatelského rozhraní Phraser

Pomocí ML vám doporučí konkrétní autory nebo styly, které by se vám mohly líbit na základě vašeho osobního vkusu.

Snímek obrazovky uživatelského rozhraní Phraser

Vytvořit dobrou výzvu je těžké, ale Phraser tento proces značně usnadňuje!

https://phraser.tech

--

--