Czym jest DALLE 2, Midjourney, Craiyon, Imagen i inne generatywne AI w wykonaniu OpenAI?

Wygenerowanie dobrych zdjęć jest trudne, skorzystaj z https://phraser.tech

Denis Shilov
Phraser
3 min readAug 9, 2022

--

Od jakiegoś czasu sztuczna inteligencja jest wykorzystywana do przywracania podartych i porysowanych fotografii oraz kolorowania czarno-białych obrazów. Kolejnym, większym krokiem naprzód są obecnie obrazy generowane przez AI.

Wszystkie te obrazy są tworzone przez DALLE 2

Obrazy te są tworzone przez sieć neuronową. Aby wytrenować sieć neuronową, podaje się jej niezliczone pary obrazów i ich opisy. Po treningu AI rozpoznaje związek między obiektami na obrazie a słowami. Jak większość zastosowań uczenia maszynowego, obrazy generowane przez AI stają się coraz bardziej przydatne. Na przykład, DALL-E 2 AI wygenerowała obraz na okładkę Cosmopolitan.

Ponieważ sieci neuronowe uczą się kojarzyć obrazy ze słowami, ich dane wejściowe to również słowa. Użytkownicy nie muszą kodować, aby stworzyć obraz. Wystarczy, że napiszą podpowiedź — opis obrazu.

Przykładowy monit

Jest to prostszy sposób, ale ma swoje ograniczenia. Na przykład dodanie “4k full hd” do zachęty zwiększa jakość obrazu, ponieważ AI kojarzy te słowa z obrazami wysokiej jakości. Nie jest to coś, czego można by się spodziewać po sieci neuronowej i nie ma możliwości, abyś wiedział to od samego początku.

Najnowocześniejsze sieci neuronowe mogą emulować style konkretnego artysty — jeśli dodasz odpowiednie słowa do podpowiedzi. W ten sposób powstaje obraz a la Degas lub zdjęcie jak u Andy’ego Warhola. Działa to również w przypadku stylów sztuki w ogóle. Ale nadal musisz rozpoznać tych artystów i style, aby móc umieścić ich nazwiska w podpowiedzi.

“Obraz robota autorstwa Salvadora Dali” vs “Obraz robota autorstwa Pablo Picasso”.

Inne aspekty zachęty, takie jak pisownia czy poziom szczegółowości opisu, mają wpływ na ostateczny obraz. Wszystko może mieć wpływ. Na przykład, jeśli będziesz chciał wygenerować dobre zdjęcie, możesz wspomnieć o “oświetleniu studyjnym” w zachęcie. Ale nadal musisz zrozumieć wszystkie te rzeczy!

Jest sposób na pisanie lepszych podpowiedzi — Phraser. Jest to aplikacja, która pomaga pisać podpowiedzi dostosowane do Twoich celów, jak również do różnych sieci neuronowych (DALL-E 2, Midjourney, Craiyon, Imagen, i tak dalej).

Phraser dzieli proces tworzenia dobrego promptu na zestaw małych kroków — wybór typu treści, stylu, uczucia, epoki, jakości i tak dalej.

Zrzut ekranu interfejsu użytkownika programu Phraser

Używa ML, aby polecić Ci konkretnych artystów lub style, które mogą Ci się spodobać na podstawie Twoich osobistych upodobań.

Zrzut ekranu interfejsu użytkownika programu Phraser

Trudno jest stworzyć dobrą podpowiedź, ale Phraser czyni ten proces znacznie łatwiejszym!

https://phraser.tech

--

--