๐ฅ์๋ณด์นด๋ ์์๊ฐ ๋ฐ๊พผ ์ธ์ โ Generative AI์ ์ญ์ฌ์ ํธ๋ ๋ ์ ๋ฆฌ ํ๋ฐ๋ฅ
๋ง๋งํ ์ธ๊ณต์ง๋ฅ์ ๊ณ์ ํ์ค๊ธฐ ๋น์ ์๋ณด์นด๋ ์์์๋ค..!
written by Bosung Park, CURG & D3LAB DAO
2021๋ 1์, ์ ์ธ๊ณ์ IT ์ ๊ณ ์ข ์ฌ์๋ค์๊ฒ ํฅ๋ฏธ๋กญ๊ฒ ๋ค๊ฐ์จ ๊ทธ๋ฆผ ํ ์ฅ์ด ์๋ค. โAvocado Armchairโ ๋ผ๊ณ ์ ๋ ฅํ๋ฉด ์ ๋ง์ ๋ค๋ฅธ ์๋ณด์นด๋ ์์ ์ฌ์ง์ ๋ณด์ฃผ๋ ์ด ๊ทธ๋ฆผ์ ๋ฐ๋ก Open AI์ DALL-E์ ๊ธฐ๋ฅ์ ์ ์ค๋ช ํ๊ธฐ ์ํ ์์์๋ค.
ํ์๋ ์ด ๋น์ ๋ฏธ๋์ ๋ต๊ณผ ๊ด๋ จ๋ ์ ๋ฌด๋ฅผ ํ๋ฉฐ ๋ค์ํ AI, ๋ธ๋ก์ฒด์ธ ํธ๋ ๋๋ฅผ ํ๋ก์ ํ๊ณ ์์๊ณ ์์ฐ์ค๋ฝ๊ฒ ์ด ์ฌ์ง์ ์ ํ๊ฒ ๋์๋ค.
โ์ ๊ธฐํ๊ธด ํ๋ฐ ์ด ๊ธฐ๋ฅ์ ์ด๋์ ์ฐ๋๊ฑฐ์ง?โ
์ ๋์ ๋๋์ด ๊ต์ฅํ ๊ฐํ๋ ๊ธฐ์ต์ด ์๋ค. 2%๋ถ์กฑํ๋ค๋ ๋๋์ ๋ค๊ฒํ๋ ์ด๋ฏธ์ง Generative AI ๊ธฐ์ ์ 1๋ ๋ฐ ์ ๋ ํ๋ฅธ ๋ค ๋ถํฐ ํฐ ๋ณํ๋ฅผ ์ผ์ผ์ผฐ๋ค. ์ง๊ธ์ ํ ํฌํฌ๋ฐ์น์ ์ผ์ฃผ์ผ์ 5๋ฒ ์ด์ ์ธ๊ธ๋๊ณ ์ฌ์ง&์์ ์ฑ์คํ ์ด 1์๋ฅผ ์ฐ๋ ์ดํ๋ฆฌ์ผ์ด์ ์ ๋ง๋ค์ด๋ด๊ธฐ๋ ํ๋ ์์ฒญ๋ ๊ธฐ์ ํธ๋ ๋๊ฐ ๋์๋ค.
์ด ๊ธ์์๋ ์๋ก์ด ๊ธฐ์ ํธ๋ ๋์ด์ AI ์ ๊ณ์ ๋ฐฉํฅ์ฑ์ด๋ผ๊ณ ์ธ๊ธ๋๊ณ ์๋ โGenerative AIโ์ ๊ฐ๋ , ๊ตฌ์กฐ, ์ญ์ฌ, ํธ๋ ๋์ ๋ํด ํํค์ณ๋ณด๊ฒ ๋ค. ํ๊ตญ์ด๋ก Generative AI ๊ด๋ จํ ๋ด์ฉ๋ค์ ์์ธํ ์ค๋ช ํ๋ ๊ธ์ด ์๋๋ฏํ๋ค. ์ด ๊ฐ๋ ์ ์ฒ์ ์ ํ๋ ๋ถ๋ค, ํ๊ตญ IT ์ ๊ณ ์ข ์ฌ์๋ค์๊ฒ๋ ์ ์ฉํ๊ฒ ์ฝํ๋ฉด ์ข๊ฒ ๋ค.
(CURG์ AI ๊ด๋ จ๊ธ์ด ์ฐธ ์ค๋๋ง์ด๋ผ ์์ํ ์๋ ์๋ค. ํ์ง๋ง CURG๋ ์๋ AI, ๊ทธ๋ฆฌ๊ณ ๋ธ๋ก์ฒด์ธ์ ํจ๊ป ๋ค๋ฃจ๋ ํํ์ด๋ค)
Generative AI๊ฐ ๋๋์ฒด ๋ญ๋ฐ?
Generative AI์ ์ ๋ฐ์ ์ธ ์ดํด๋ฅผ ๋๊ธฐ ์ํด์ ๊ธฐ๋ณธ ๊ฐ๋ ๊ณผ ์ง๊ธ๊น์ง์ ๋ฐ์ ์ญ์ฌ์ ๋ํด ์ดํด๋ณด๊ฒ ๋ค.
Generative AI์ ๊ฐ๋
์ง๊ธ๊น์ง์ AI vs ์ง๊ธ๋ถํฐ์ AI
์ง๊ธ๊น์ง์ ์ธ๊ณต์ง๋ฅ ๊ธฐ์ ์ ์ฃผ์ด์ง๋ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ๋ค์์ ์์ธกํ๊ฑฐ๋, ์ถ์ฒ์ ํด์ฃผ๋ Analytical AI ํฅ์ผ๋ก ๋ฐ์ ํด์๋ค. (Traditional AI) ์ ํ๋ธ, ๊ตฌ๊ธ, TikTok ๋ฑ์ ํ๋ซํผ์์ ์ถ์ฒํด์ฃผ๋ ๋ค์ํ ๊ด๊ณ ๋ ์ฌ๊ธฐ์ ํด๋นํ๋ค.
์๋ ๊น์ง๋ง ํด๋ AI๊ฐ ์ฌ๋๋ค์ด ํ๋ โ์ฐฝ์โ ํ์๋ฅผ ์ง๊ธ์ ์์ค๊น์ง ํ ์ ์์ผ๋ฆฌ๋ผ ์์ํ๊ธฐ๋ ์ด๋ ค์ ๋๊ฒ ๊ฐ๋ค. ๋น์ฐํ DALL-E2 ์ด์ ์ DALL-E๋ ์กด์ฌํ๊ณ ์ธ๊ณต์ง๋ฅ์ ๊ธฐ๋ฐ์ผ๋ก โ์๊ณก' ํ์๋ฅผ ํ๋ ๋ฑ์ ์ฌ๋ก๋ ๋ํ๋๊ธด ํ์ง๋ง ์ฌ๋์ด ์ฌ์ ํ ๋ ์ํ ์ ์๋ ์์ญ์ด๋ผ๋ ํ์ ์ด ๋ค ์ ๋๋ก ๊ธฐ์ ์ด ๋ฐ์ด๋์ง๋ ์์๋ค. Generative AI ๊ด๋ จ ๊ธฐ์ ์ด ์ ์ ๊ณ ๋ํ๋๋ฉด์ ์ฌ๋ ๊ณ ์ ์ ์์ญ์ด๋ผ๊ณ ์๊ฐํ๋ ์๋ก์ด ์ปจํ ์ธ ์ฐฝ์กฐ, ์ฐฝ์ ๋ง์ ๋ AI๊ฐ ํ ์ ์๋ ์ผ์ด ๋์ด๊ฐ๊ณ ์๋ค.
Generative AI Models Landscape
ํ์ฌ ๋ค์ํ ์ดํ๋ฆฌ์ผ์ด์ ์ด ๋ง์ด ๋ฑ์ฅํ๊ณ ์๋ ์์ญ์ด โ์ด๋ฏธ์ง (visual)โ ์์ญ์ด๊ธฐ ๋๋ฌธ์ Generative AI๋ฅผ ๋ ์ฌ๋ฆฌ๋ฉด Art AI์ ๊ฐ์ ๊ฐ๋ ์ด๋ผ๊ณ ์ฐ๊ด์ํค๊ธฐ ์ฝ๋ค. ํ์ง๋ง Generative AI๋ ๋ค์ํ ํํ์ ์ปจํ ์ธ ์ธํ(input)์ ๋ฐํ์ผ๋ก ์๋ก์ด ํํ์ ์ปจํ ์ธ ๊ฒฐ๊ณผ๋ฌผ(output)์ ๋ง๋ค์ด๋ด๋ ๊ฒ์ ๋ปํ๊ธฐ ๋๋ฌธ์ ํ ์คํธ, ์ด๋ฏธ์ง, 3D, ๋น๋์ค, ์ฝ๋, ์คํผ์น, ์ค๋์ค ๋ฑ ๊ฑฐ์ ๋ชจ๋ ์ปจํ ์ธ ํฌ๋งท์ ํฌํจํ๋ค.
์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ํ์ฌ๊น์ง ๋ค์ํ ํฌ๋งท์ ์ฝํ ์ธ ์์ญ์์ Generative AI ๋ชจ๋ธ๋ค์ด ๋ฑ์ฅํ๋ค. ๋๋ฌด๋ ์ ์๋ ค์ ธ ์๋ ์ด๊ฑฐ๋ ์ธ์ด๋ชจ๋ธ์ธ GPT3, Bloom๋ Generative AI์ ๊ฐ์ฅ ํต์ฌ์ ์ธ ๋ชจ๋ธ๋ก ์๋ฆฌ์ก๊ณ ์๋ค.
Generative AI์ ํฌ๋งท๊ณผ ๊ด๋ จํด์ ๋ง์ ๋ถ๋ค์ด ๊ฐ ์ปจํ ์ธ ํฌ๋งท ์์์ ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ์ด ์์ฒด์ ์ผ๋ก ๋ฐ์ ํ ์ ์๋ค๊ณ ์คํดํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์๊ฒ ๊ฐ๋ค. ๋ฌผ๋ก Image-to-Image์ ๊ฐ์ ํํ๋ ๊ฐ๋ฅํ๊ธด ํ์ง๋ง ๋ ๋ค์ํ ํฌ๋ฆฌ์์ดํฐ์ ์ฝํ ์ธ ๋ฐ๊ตด์ ์ํด์๋ Text๊ธฐ๋ฐ์ Generative AI ๋ชจ๋ธ์ด ์ค์ฌ์ ์ก์์ฃผ๋๊ฒ ์ค์ํ๋ค๋ ์ ์ ๊ฐ์กฐํ๊ณ ์ถ๋ค.
์ Landscape ๊ทธ๋ฆผ์ ์๋ ์ฝํ ์ธ ๋ ์ด์ด๋ค๋ ๊ฐ๊ฐ์ ๋ปํ๊ธฐ ๋ณด๋ค ๋ค์๊ณผ ๊ฐ์ด Text-to-X๋ก ๋ณผ ์ ์๋ค.
โ Text :Text-to-Text
๊ฐ์ฅ ๋ํ์ ์ผ๋ก OpenAI๊ฐ Large-language-models (LMMs) ๊ธฐ๋ฐ์ผ๋ก ํ๊ณ ์๋ GPT2, GPT3, ChatGPT์ ๊ฐ์ ๋ค์ํ ์๋๊ฐ ์ฌ๊ธฐ์ ํด๋นํ๋ค. 2022๋ 11์ 30์ผ์ ๋ฑ์ฅํ ChatGPT๋ ๋ํ๋ฅผ ํตํด ๊ฒ์๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์๋ ์ธ์ด๋ชจ๋ธ์ด๋ค.
โก Image : Text-to-Image
ํ์ฌ ๊ธ๋ก๋ฒ IT ์ ๊ณ๋ฅผ ๊ฐ์ฅ ๋จ๊ฒ๊ฒ ๋ฌ๊ตฌ๊ณ ์๋ ์์ญ์ด ์ด ์ด๋ฏธ์ง ๊ด๋ จ Generative AI ์ด๋ค. ์์ฐ์ด๋ฅผ ํ๋กฌํํธ์ ์ ๋ ฅํ์๋ ๊ทธ ์ธ์ด๋ฅผ ์ดํดํ๊ณ ๊ฒฐ๊ณผ ์ด๋ฏธ์ง๋ฅผ ๋ด๋ณด๋ด๋ GPT3๊ธฐ๋ฐ DALL-E2, Midjourney, Stable Diffusion ๋ฑ์ด ์ฌ๊ธฐ์ ํด๋นํ๋ค. ์ถํ์ ๋ ์์ธํ ์ดํด๋ณด๊ฒ ๋ค.
โข Speech : Text-to-Speech
ํ ์คํธ๋ฅผ ์ ๋ ฅํ์๋ ๊ทธ ์ฝํ ์ธ ์ ์ ์ ํ ๋ชฉ์๋ฆฌ์ ์ค๋์ค๋ฅผ ๋ง๋ค์ด์ฃผ๋ ์์ญ์ด๋ค. Hugging Face์ ์คํ์์ค ๋ชจ๋ธ๋ค ๊ธฐ๋ฐ์ผ๋ก ์ค์๊ฐ text-to-voie๋ฅผ ๊ฐ๋ฅํ๊ฒ ํด์ฃผ๋ Wellsaid์ ๊ฐ์ ์๋น์ค๋ค์ด ๋ฑ์ฅํ๊ณ ์๋ค.
โฃ Video: Text-to-Video
Text-to-Image์์์ Image๊ฐ ์์ง์ด๋ ๋๋์ด๋ผ๊ณ ์ดํดํ๋ฉด ๋๋ค. ์ ๊ธฐํ๊ฒ๋ ์ด ์์ญ์ Google, Meta์ ๊ฐ์ Tech Giants๋ค์ด Phenaki, Make-a-Video์ ๊ฐ์ ๋ชจ๋ธ์ ๊ณต๊ฐํ๋ฉฐ ์ ์ ํ๊ธฐ ์ํ ๋ ธ๋ ฅ์ ํ๊ณ ์๋ค.
๊ฒฐ๊ตญ ์ฌ๋๋ค์ด ์ ๋ ฅํ ํ ์คํธ์ ๋ํ ์ดํด๋ฅผ ๋ฐํ์ผ๋ก ์์ ์๋ก์ด ํ ์คํธ, ์ด๋ฏธ์ง, ์คํผ์น, ๋น๋์ค ์ฝํ ์ธ ๋ฅผ ๋ง๋ค์ด๋ด๋๊ฒ์ด ํ Generative AI์ ํต์ฌ์ด๋ค. ์ธ์ด๋ชจ๋ธ์ ๊ณ ๋ คํ์ง ์์ Generative AI๋ (๋ฌผ๋ก ์ฉ๋์ ๋ฐ๋ผ ์๋ฏธ๊ฐ ์์์๋ ์๊ฒ ์ง๋ง. ex. ์นํฐ ์ฑ์) ํ์ฌ ํธ๋ ๋์์์ ํต์ฌ์ ์๋๋ผ๊ณ ์๊ฐํ๋ค.
์๊ณ ๊ฐ๋ฉด ์ข์ Generative AI์ ๋ฐ์ ๊ณผ์
ํ์๋ ์ฒ์์ Generative AI๋ฅผ ์ด ์๋ฉ์ผ๋ก๋ง ์ ํ์๋๋ ๋๊ฒ ์๋ก์ด ๊ฐ๋ , ๊ณต๋ถํ ๊ฒ ์์ฃผ์์ฃผ ๋ง์ ๋ถ์ผ์ฒ๋ผ ๋๊ปด์ก์๋ค. ํ์ง๋ง ์ด ๋ฐ์ ๊ณผ์ ์ญ์ฌ๋ฅผ ์ญ ์ดํด๋ณด๋ ํจ์ฌ ์ดํดํ๊ธฐ๊ฐ ์ฌ์ ๋ค. ์ด ๊ธ์ ์ ๋ชฉ๋ ์ด ๊ณผ์ ์ ๊ฑฐ์น๋ฉด์ ๋ฝ์๋ด๊ฒ ๋์๋ค. ํต์ฌ์ ๋ํ ์ดํด๋ฅผ ๋๊ณ ์ ์ญ์ฌ ํํ์ ์ ๋ฆฌํด๋ณธ๋ค.
2021๋ 1์, DALL-E์ ๋ฑ์ฅ๊ณผ ํจ๊ป ์๋์ ๊ฐ์ MIT Technology Review ๊ธฐ์ฌ๊ฐ ์๋ณด์นด๋ ์์ ์ฌ์ง๊ณผ ํจ๊ป ๋์จ๋ค. ๊ทธ๋ฆฌ๊ณ โThis avocado armchair could be future of AIโ ๋ผ๋ ์ด ๊ธฐ์ฌ์ ์ ๋ชฉ์ ํ์ค์ด ๋์๋ค.
Generative AI Model์ ์ญ์ฌ๋ฅผ ์๋์ ๊ฐ์ด ์ ๋ฆฌํด๋ดค๋ค. ํ์ฌ๊น์ง ๋ค์ํ ์ดํ๋ฆฌ์ผ์ด์ ์ด ๋์จ ์์ญ์ด ์ด๋ฏธ์ง์ ํ ์คํธ์ด๊ธฐ ๋๋ฌธ์ ์ด ๋๊ฐ์ ์ฝํ ์ธ ํฌ๋งท ์์ฃผ๋ก ๋ฐ์ ๊ณผ์ ์ด ์ ๋ฆฌ๋์ด ์๋ค.
ํ์ฌ ๊ธ๋ก๋ฒ ํ ํฌ์ ๊ณ๋ฅผ ๋๋ํค๊ณ ์๋ DALL-E2, Stable Diffusion, Midjourney ๋ ์ ๋ ๋ ์์ ์ธ ๋ชจ๋ธ๋ก ๋ฐ์ ํ ๊ฒ์ด ์๋๋ค. 1980๋ ๋ ๋ถํฐ์ RNN, ๊ทธ๋ฆฌ๊ณ CNN ์ ๋ํ ์ธ์ด ์ด๋ฏธ์ง ์ฐ๊ตฌ๊ฐ ๋ฐ์ ํ์ฌ ๋์ค๊ฒ๋ ๊ฒฐ๊ณผ๋ฌผ์ด๋ค. DALL-E๋ Art AI์ ํนํ๋ ์๋ก์ด ๋ชจ๋ธ์ด ์๋, GPT3์ ๊ฐ์ ์ธ์ด๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ํ๊ณ ์๋ค.
- (2014~) GAN, Generative Adversarial Networks : ์ฌ๋๋ค์๊ฒ ๋ณธ๊ฒฉ์ ์ผ๋ก Generativa AI์ ๋ํ ์กด์ฌ๊ฐ ์๋ ค์ง๊ธฐ ์์. ๋ค์์ ์ด๋ฏธ์ง์์ ํจํด์ ์ถ์ถํด ์๋ก์ด ์ด๋ฏธ์ง๋ฅผ ๋ง๋ค์ด๋ด๋ ๊ธฐ์ . ์งํ/๊ฐํ ํ์ ํ๋ ์์ญ์๋ ํ์ฉ ๊ฐ๋ฅ. GAN๊ณผ ๊ด๋ จ๋ ๊ณผ๊ฑฐ CURG ์ฝํ ์ธ ๋ ์กด์ฌ.
- (2017~) LLMs, Large Language Models : Transformer ์์ญ์์์ ๋ฐ์ ์ด ์์๋จ. GPT3, LaMDA, Gopher ๋ฑ์ ์ด๊ฑฐ๋ํ ์ธ์ด๋ชจ๋ธ์ ๋ฐ์ ์ด ์์ํ ์์ .
- (2019.08.29) GPT2์ ๋ฑ์ฅ
- (2020.07.20) GPT3์ ๋ฑ์ฅ
- (2021.01.05) DALL-E์ CLIP์ ์ฒซ ๋ฑ์ฅ : โOpenAI has extended GPT-3 with two new models that combine NLP with image recognition to give its AI a better understanding of everyday concepts.โ CLIP (Contrastive Language-Image Pre-training)์ ํ ์คํธ๋ฅผ ์ด๋ฏธ์ง์ ์ฐ๊ฒฐ์์ผ์ฃผ๋, GPT3์ DALL-E์ ์ฐ๊ฒฐ๊ณ ๋ฆฌ๊ฐ ๋๋ ๊ธฐ์ .
- (2022.04) DALL-E2์ ๋ฑ์ฅ : DALL-E2์ ๋ฑ์ฅ ์งํ Midjourney, Stable Diffusion ์ฐ์ด์ด ๋ฑ์ฅ.
- (2022.07) Midjourney์ ๋ฑ์ฅ
- (2022.08) Stable Diffusion์ ๋ฑ์ฅ
๋ฐ์ ๊ณผ์ ์ ์ดํด๋ณด๋ค ๋ณด๋ ํ ์คํธ โ ์ด๋ฏธ์ง Generative AI๋ก ์ด์ด์ง๋ ํ๋ฆ ์์ฃผ๋ก ๋ด๊ฒ ๋์๋ค. ์ด ์ดํ์๋ ๋น์ฐํ ๋น๋์ค, ์คํผ์น, 3D ์์ญ์์์ ๊ธฐ์ ๋ฐ์ ๋ ๊ณ์๋ ๊ฒ์ด๋ค.
์ด๋ฏธ์ง Generative AI ๋ํ๋ชจ๋ธ ์ ๊ฒฉ ๋น๊ต๋ถ์
์ด๋ฏธ์ง Geneartive AI์ ๋ํ 3๋์ฅ์ผ๋ก ๋ถ๋ฆฌ๊ณ ์๋ OpenAI, Stability AI ๊ทธ๋ฆฌ๊ณ Midjourney์ ๋ํด์ ํ๋ฒ ์ดํด๋ณด๊ฒ ๋ค. ์ ๋ง ๋ง๋ ์๋๊ฒ ์ ๊ธฐํ๊ฑด ์ฌํด 4์๋ถํฐ ๋ฑ์ฅํ ๋ชจ๋ธ๋ค์ด ๋ช ๊ฐ์๋ง์ ๊ต์ฅํ ํฐ ์ํฅ๋ ฅ์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค๋ ๊ฒ์ด๋ค.
์์ธํ ๋ด์ฉ์ ๋ณด๊ธฐ ์ ์ ์ด๋ฏธ์ง ๋ชจ๋ธ์ด๋ค ๋ณด๋ ์ด๋ฏธ์ง๊ฐ ์ด๋ป๊ฒ ๋์ค๋์ง์ ๋ํ ๋๋์ ์ดํด๋ณด๋๊ฒ ์ข์๊ฒ ๊ฐ๋ค. ์๋ ๊ทธ๋ฆผ์ โPixar movie scene of a dark skill wizard fighting against Kermit the frog as a gladiator, incredible render, Prestoโ ๋ผ๊ณ ๋๊ฐ์ ๋ช ๋ น์ด๋ฅผ ์ ๋ ฅํ์๋ ์ธ ๊ฐ์ ๋ชจ๋ธ์์ ์ด๋ป๊ฒ ๋ค๋ฅธ ์ด๋ฏธ์ง ๊ฒฐ๊ณผ๋ฌผ์ด ๋์ค๋์ง ๋ณด์ฌ์ค๋ค. ์๋ ๊ทธ๋ฆผ๋ง ๋ฑ ๋ด๋ ์ธ ๋ชจ๋ธ์ด ์งํฅํ๋ ๊ทธ๋ฆผ์ฒด๊ฐ ๋ค๋ฅด๋ค๋๊ฑธ ์ ์ ์๋ค.
์์ ๊ฐ์ ๋ช ๋ น์ด๋ฅผ ๋ดค์๋๋ ์์ฐ์ด๋ฅผ ๊ทธ๋ฆผ์ผ๋ก ๋ํ๋ด๋๊ฒ์ด ์ผ๋ง๋ Generative AI์์ ์ค์ํ๊ฑด์ง ์ดํดํ๊ธฐ ํ๋ค์๋ ์๋ค. ํ์ง๋ง ์๋ Midjourney ๊ฒฐ๊ณผ๋ฌผ๊ณผ ๊ฐ์ ๊ทธ๋ฆผ์ ๊ทธ ์ค์์ฑ์ ์ถฉ๋ถํ ๋ณด์ฌ์ค๋ค. ์ค๋ฅธ์ชฝ์ ๋ง๋ ์๋๊ฒ ์ถ์์ ์ด๊ณ ํ์ฉ์ฌ ๊ฐ๋ํ ์ค๋ช ์ Midjourney ๋ชจ๋ธ์์ ์ถฉ๋ถํ ์ดํดํ๊ณ ์ผ์ชฝ๊ณผ ๊ฐ์ ๊ฒฐ๊ณผ๋ฌผ์ ๋ด๋์ ๊ฒ์ด๋ค.
Generative AI ๊ฐ ๋ฐ์ ํ๋ฉด ํ ์๋ก ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ์ด ์ดํดํ ์ ์๋ ์์ฐ์ด๋ฅผ ์ ํ์ด๋ด์ด ์ํ๋ ๊ฒฐ๊ณผ๋ฌผ์ ๋ผ ์ ์๊ฒ ๋์์ฃผ๋ Prompt Engineering, ๊ทธ๋ฆฌ๊ณ ๊ด๋ จ ์ง์ ์ด ๋์ฑ ๋ ํฅํ ๊ฒ์ด๋ค.
(2022.04) DALL-E2
DALL-E2๋ Open AI ์์ 2020๋ ์ ๊ณต๊ฐํ๋ ๊ธฐ์กด DALL-E๋ฅผ ์ ๊ทธ๋ ์ด๋ํ์ฌ ๊ณต๊ฐํ ๋ชจ๋ธ์ด๋ค.
์๋ ๊ทธ๋ฆผ๋ง ๋ด๋ ๊ธฐ์กด DALL-E ๋ชจ๋ธ์์ ๋์จ โ์๋ณด์นด๋ ์์โ๋ณด๋ค ํจ์ฌ ์ ๊ทธ๋ ์ด๋ ๋ ์์๋ค์ด DALL-E2๋ฅผ ํตํด์๋ ๊ตฌํ ๊ฐ๋ฅํจ์ ํ์ธํ ์ ์๋ค.
DALL-E2๋ ์ปจ์ , ํน์ง, ๊ทธ๋ฆฌ๊ณ ์คํ์ผ์ ์ตํฉํ์ฌ ๊ทธ๋ฆผ์ ์ฐฝ์ํ ์ ์๋ค. (can combine concepts, attributes, and styles) ๋ง์ ์ ๊ณ์ ๋ฌธ๊ฐ๋ค์ ์ด ๋ชจ๋ธ์ด ๋ฑ์ฅํ ์์ ์ด Generative AI๊ฐ ๋ถํธํ ๊ณจ์ง๊ธฐ (Uncanny Valley)๋ฅผ ๋์ด์ ์์ ์ด๋ผ๊ณ ๋ณธ๋ค.
๊ทธ ์์กฐ ๋ต๊ฒ Stable Diffusion(SD), Midjourney(MJ)์ ์ด๋ฏธ์ง ๊ฒฐ๊ณผ๋ฌผ์ ๋น๊ตํ์๋๋ ํจ์ฌ ์ฌ์ค์ ์ธ ๋ชจ์ต์ ๋ณด์ฌ์ค๋ค. ์ค์ฌ์ ๋ชจ์ต์ ์ ๋ฐ์ํ๊ธฐ์๋ DALL-E2๋ชจ๋ธ์ด ๊ฐ์ฅ ์ ํฉํ๋ค๊ณ ๋ณด์ฌ์ง๋ค.
Stable Diffusion
Stable Diffusion์ Stability AI์์ ์ฌํด 8์์ ๊ณต๊ฐํ ๋ชจ๋ธ์ด๋ค. ๊ณต๊ฐ๋์ง 3โ4๊ฐ์ ๋ฐ์ ์๋ ์์ ์์ ์ง๊ธ๊ณผ ๊ฐ์ ํ๊ธ๋ ฅ์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค๋ ์ฌ์ค์ด ์์ผ ๋๋จํ๊ฒ ๋๊ปด์ง๋ค.
Stable Diffusion์ 3๋ ์ด๋ฏธ์ง Generative AI ๋ชจ๋ธ์ค์์๋ ๊ฐ์ฅ ๋ชจ๋ํ ๊ทธ๋ํฝ ์ํธ์ ๊ฐ๊น์ด ๋๋์ด๋ค.
๋ค๋ฅธ ๋ ๋ชจ๋ธ๊ณผ ๊ฐ์ฅ ์ฐจ๋ณ์ ์ธ ๋ถ๋ถ์ ๋ฐ๋ก ์คํ์์ค๋ผ๋๊ฒ์ด๋ค. ๋ค๋ฅธ ๋ชจ๋ธ์ ์ ๋ฃ๋ก ์ด์ฉํ ์ ์์ง๋ง ์คํ์์คํ ์ํค๋ฉฐ ์ ๋ง์ ์ดํ๋ฆฌ์ผ์ด์ ์ ๋ง๋ค์ด๋ด๊ณ ์๋ค. Github์ ๊ฐ์ ๊ฐ๋ฐ์ ์ปค๋ฎค๋ํฐ์์๋ ๋ง์ ์ธ๊ธ์ด ๋๊ณ ์์ผ๋ฉฐ ํฌํ ์ต์ Stable Diffusion์ ์ฝ์ ํ๋ ํ๋ฌ๊ทธ์ธ, ์ค๋ฌผ ์ ์นด ๊ธฐ๋ฐ์ ์๋ฐํ ์ ์ ์๋น์ค ๋ฑ ๋ค์ํ ์๋น์ค๋ค์ด ๋ฑ์ฅํ๊ณ ์๋ค.
โI wanted to meet creative professionals where they were and I wanted to empower them to bring AI into their workflows, not blow up their workflows,โ
_ Cantrell, developer of the plug-in
Stable Diffusion์ด ๋ง์ ๊ฐ๋ฐ์, ๋์์ด๋๋ค์ด ์ฝ๊ฒ ์ด๋ฏธ์ง Generative AI ๋ชจ๋ธ์ ์ ์ฉํ ์ ์๋ ํ๊ฒฝ์ ๋ง๋ค์ด์ฃผ๋ฉด์ ์ํ๊ณ ํ์ฅ์ ์ ๋ง ๋ง์ด ๊ธฐ์ฌํ๊ณ ์๋๊ฒ ์๋๊ฐ ์๊ฐ์ด ๋ ๋ค. ์ง๊ธ์ ์์ ์กํ๋ Generative AI ๊ธ๋ก๋ฒ ํธ๋ ๋๊ฐ ๋ง๋ค์ด์ง๋๋ฐ์ ์ฃผ์ญ ์ญํ ์ ํ๋ค๊ณ ๋ณธ๋ค.
๋ค๋ง, ๊ทธ ๋งํผ ํฌ๋ฅด๋ ธ, ์ ์๊ณผ ๊ฐ์ ์๊ทน์ ์ธ ์ด๋ฏธ์ง ์์ฑ์๋ ์ทจ์ฝํ๊ฒ ๋ ธ์ถ๋์ด ์๊ธฐ๋ ํ๋ค.
Midjourney
Midjourney๋ ๊ธฐ์ ์ด ์๋ ๋น์๋ฆฌ ์ฐ๊ตฌ๋จ์ฒด์์ ์ฌ 7์์ ๊ณต๊ฐํ ๋ชจ๋ธ์ด๋ค. ์ฌ์ง๋ณด๋ค๋ ๋ฏธ์ ์ ๊ฐ๊น์ด ๊ทธ๋ํฝ์ ๋ณด์ฌ์ค๋ค. ๋ค์๊ณผ ๊ฐ์ Midjourney์ ๋ํ ์ธ๊ธ๋ค์ด ๊ทธ ์ปจ์ ์ ์ ๋ณด์ฌ์ฃผ๋๋ฏํ๋ค.
โI feel Midjourney is an art student who has its own style. And when you invoke my name to create an image, itโs like asking an art student to make something inspired by my artโ
_ Midjourney Artist
โPerfect photos make me a little uncomfortable right now, though I do see legitimate reasons why you might want something more realistic.โ
_ Midjourney Developer
๊ฐ์ฅ ํฐ ํน์ง์ ์๋์ ๊ฐ์ด ๋์ค์ฝ๋๋ฅผ ํตํด ๋ชจ๋ธ์ ํ์ฉํ ์ ์๊ฒ ์ ๊ณตํ๊ณ ์๋ค๋ ์ ์ด๋ค.
์ํ๋ ํ ์คํธ๋ฅผ ์๋์ ๊ฐ์ด ์ ๋ ฅํ๋ฉด ๋์ค์ฝ๋ ์ฑ๋ ๋ด์์ ๊ฒฐ๊ณผ๋ฌผ ์ด๋ฏธ์ง๊ฐ ์์ฑ๋๋ค. ๋์ค์ฝ๋๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ค๋ณด๋ Midjourney ์ค์ฌ์ ์ปค๋ฎค๋ํฐ ๋น๋ฉ๋ ์ฝ๊ฒ ์๋ํ๊ณ ์๋ค.
์ผ๋ถ ๋ฌด๋ฃ๋ก ์ฌ์ฉํ๋ค๊ฐ ๋์ ๋ด์ผ ํ๋ ๊ตฌ์กฐ์ด๋ฉฐ ๋ชจ๋ธ์ ๊ณต๊ฐํ์ง 1โ2๋ฌ๋ง์ ๋ฒ์จ ๊ฝค ๋ง์ ๋งค์ถ์ ๋ง๋ค์ด๋ด๊ณ ์๋ค๋ ์๊ธฐ๋ ๋ค์๋ค.
์ด๋ฏธ์ง Generative AI ์ดํ๋ฆฌ์ผ์ด์ ์ ๋ฐ์ ๋ฐฉํฅ์ฑ
์ต๊ทผ ํธ๋ ๋
์ดํ๋ฆฌ์ผ์ด์ ๋จ์ use-case๋ค์ด ๋ง์ด ๋ฑ์ฅํ๊ณ ์๋ค. ์ธ๊ณต์ง๋ฅ ์ ๊ณ ์ญ์ฌ์ ์ด๋ ๊ฒ ๊ธฐ์ ํธ๋ ๋๊ฐ ๋ค์ํ ์ดํ๋ฆฌ์ผ์ด์ ๊น์ง ์ด์ด์ง ๊ฒฝ์ฐ๋ ์ฒ์์ด ์๋๊ฐ ์ถ๋ค. ์ธ๊ณต์ง๋ฅ์ ํฌํจํ ๋ฅํ ํฌ ๋ถ์ผ์์๋ ์ด์ ๊ฐ์ ์ผ์ด์ค๋ ์ด๋ก์ ์ด๋ค.
์ ๋ง์ ์ดํ๋ฆฌ์ผ์ด์ ์ด ๋ฑ์ฅํ๊ณ ์์ง๋ง ์ ์ ์ ์ ํ์ ๋ฐ์ ๋ ์๋น์ค๋ฅผ ๊ฐ๋จํ ์ดํด๋ณด๊ฒ ๋ค.
Dream by Wombo
NFT๊ทธ๋ฆผ์ ํธ์งํ๋ ๊ธฐ๋ฅ์ ๋ํ๋ฉฐ ์ํฐ์คํธ๋ค์ ๊ด์ฌ์ ๋ถ๋ฌ์ผ์ผํจ ์ด ํด์ ์ฌํด Google Play์์ Best App์ผ๋ก ์ ์ ๋๊ธฐ๋ ํ๋ค.
ํ ์คํธ๋ฅผ ์ ๋ ฅํ์๋ ๊ทธ๋ฆผ์ ์์ฑํด์ฃผ๋๊ฒ ๋ฟ๋ง ์๋๋ผ ์์ ์ด ๋ณด์ ํ๊ณ ์๋ ์ด๋ฏธ์งํ์ผ ํน์ ์์ ํ๊ณ ์๋ NFT์ด๋ฏธ์ง๋ฅผ ๋ฃ์ด์ ์๋ก์ด ๋๋์ผ๋ก ๋ง๋๋ ๊ธฐ๋ฅ๋ ์ ๊ณตํด์ฃผ๊ณ ์๋ค.
Lensa AI โMagic Avatarโ
ํ๊ตญ์ธ๋ก ์์๋ ์ฌ์ฌ ๋ณด๋ํ๊ธฐ ์์ํ Lensa AI์ Magic Avatar๊ธฐ๋ฅ์ Stable Diffusion ๋ชจ๋ธ ๊ธฐ๋ฐ์ผ๋ก ์ ์ ์ฌ์ง ๊ธฐ๋ฐ์ ์บ๋ฆญํฐ๋ฅผ ์์ฑํด์ฃผ๋ ๊ฒ์ด๋ค.
Data.ai (๊ตฌ App Annie) ๊ธฐ์ค์ผ๋ก 2022๋ 12์ 3์ผ ๊ธฐ์ค ์กํฐ๋ธ ์ ์ ์๋ 550๋ง๋ช ์ ํ์ฉ ๋์ด์ ์ํฉ์ด๋ค.
Top Grossing App์ผ๋ก ๋ฏธ๊ตญ, ์บ๋๋ค, ์๊ตญ, ๋ ์ผ, ํ๋์ค์ ์์ ๋ญํฌ๋ฅผ ํ๊ฒ ๋๋ฉด์ ์ ๋ง์ ์ธ๋ก ์ ๊ด์ฌ์ ๋ฐ๊ณ ์๊ธฐ๋ ํ๋ค.
ํ์๋ 2019๋ ๋์ ๊ฑฐ์ ๋งค์ผ Techcrunch๋ฅผ ๋ณด๊ณ ์๋ค. ์ง๊ธ๊น์ง ์ดํ ์ฐ์ Techcrunch์ ๋ฑ์ฅํ ์๋น์ค๋ Lensa AI๊ฐ ์ฒ์์ด๋ค.
์ค์ ๋ก โMagic Avatarโ ๊ธฐ๋ฅ์ ์ฌ์ฉํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ์ ๊ณผ์ ๋ค์ ๊ฑฐ์น๊ฒ ๋๋ค. ์ฑ
๋จ์ํ๊ฒ ๋งํ๋ฉด ์ ์นด 10โ20๊ฐ๋ฅผ ๋ฃ๊ณ 10,000์ ์ ๋์ ๋์ ๋ด๋ฉด ๋ ์๊ฐ ๋์ 50โ100๊ฐ์ ์๋ฐํ๋ฅผ ์์ฑํด์ฃผ๋ ๊ธฐ๋ฅ์ด๋ค. ๊ฒฐ๊ณผ ์ด๋ฏธ์ง๋ ์๋์ ๊ฐ๋ค.
๊ต์ฅํ ๋ค์ํ ๊ทธ๋ฆผ์ฒด์ ์๋ฐํ๋ฅผ ์์ฑํด์ค๋ค. ์ธ์คํ๊ทธ๋จ์ด๋ ๊ธฐํ SNS์ ์ ๋ก๋ํ๊ธฐ์๋ ํ๋ฆฌํฐ๊ฐ ๊ด์ฐฎ์์ ์ ์ ๋ค์๊ฒ ๋ง์ ๊ด์ฌ์ ๋ฐ๊ณ ์๋๊ฒ ์๋๊ฐ ์ถ๋ค. ํ์ฌ Lensa AI์ ์ธ์คํ๊ทธ๋จ ํ๋ก์์๋ 28๋ง๋ช ์ด๋ค.
ํํฐ์นด๋ฉ๋ผ๋ก ์ฐ์ ์ ์นด๋ ๊ฐ์ง์ผ๊ตด.. Lensa AI๋ ๊ฐ์ง์ผ๊ตด.. ๊ฐ์ง์ ๊ฐ์ง๊ฐ ํฉ์ณ์ ธ ์์ฒญ๋ ๊ฐ์ง์ผ๊ตด์ ๋ง๋ค์ด๋ธ๊ฒ ๊ฐ๋ค.
๊ฐ์ฅ ์ธ๊ธ์ด ๋ง์ด ๋๋ ์์ฅ.. (๋น์ฐ) ํฌ๋ฅด๋ ธ
์ธ๋ฅ๊ฐ ์ง๊ธ๊น์ง ์ฑ์ฅํด์จ ์ญ์ฌ, ๊ธฐ์ ์ด ๋ฐ์ ํด์จ ์ญ์ฌ, Youtube/Facebook๊ณผ ๊ฐ์ ์๋น์ค๊ฐ ๋ฐ์ ํด์จ ์ญ์ฌ๋ฅผ ๋ด๋ ํฌ๋ฅด๋ ธ๋ ๊ทธ ์ค์ฌ์ ์์๋๊ฒ ๊ฐ๋ค. Generative AI ๋ ์์ธ๋ ์๋๋ค.
Stable Diffusion์ด ์์ผ๋, Unstable Diffusion๋ ๋ฑ์ฅํ๊ฒ์ผ๊น.. ํฌ๋ฅด๋ ธ ์ฌ์ง์ ์์ฑํด๋ด๋ ๋ชจ๋ธ์ด ๋์ค์ฝ๋์ ๋ฑ์ฅํ๊ธฐ๋ ํ๋ค.
Lensa AI์ โMagic Avatarโ๊ธฐ๋ฅ๋ ์ด ํ ํฌํธ๋ฆฌ(?)๋ฅผ ๊ทธ๋๋ก ๋ฐ๋ผ๊ฐ๊ณ ์๋ค.
Generative AI์ ๋ฏธ๋
๊ธ๋ก๋ฒ ํ ํฌ๊ธฐ์ ๋ค์ ์์ง์, Text-to-Video
Meta๋ ์ฌํด 9์์ text-to-video๋ฅผ ๊ฐ๋ฅํ๊ฒ ํด์ฃผ๋ Make-a-Video๋ผ๋ ๋ชจ๋ธ์ ๊ณต๊ฐํ๋ค. (๋งํฌ์ ์ปค๋ฒ๊ฑฐ๋ ๊ต์ฅํ ํฅ๋ฏธ๋ฅผ ๋ณด์ธ..)
์ด๋ฏธ์ง Generative AI ๋ชจ๋ธ๋ค์ ํ ์คํธ๋ฅผ ์ด๋ฏธ์ง๋ก ๋ฐ๊ฟ์ค๋ค๋ฉด, ์ด ๋ชจ๋ธ์ ํ ์คํธ ํน์ ์ด๋ฏธ์ง๋ฅผ ๊ฒฐํฉํ์ฌ ๋น๋์ค๋ฅผ ๋ง๋ค์ด์ค๋ค. ์ฌ๋ฐ๋ ์งค ์์ฑ์๋ ๊ต์ฅํ ์ ์ฉํ ๋ชจ๋ธ์ด๋ผ Giphy์ ๊ฐ์ ์๋น์ค์ ๊ฒฐํฉ๋๋ ๊ทธ๋ฆผ๋ ๊ต์ฅํ ์ฌ๋ฐ์ง ์์๊น ์๊ฐ์ด ๋ ๋ค.
Meta์ ์ง ์ ์๋ Google Research์์๋ Phenaki๋ผ๋ text-to-video ๋ชจ๋ธ์ ๊ณต๊ฐํ๋ค.
ํ ํฌ ์์ด์ธํธ๋ค์ โ๋ํฌ๊ฐ ์ด๋ฏธ์ง๋ฅผ ํ๋ค๋ฉด ์ฐ๋ฆฌ๋ ๋น๋์ค๋ฅผ ํ๊ฒ ๋ค' ๋ผ๋ ์์ง์์ธ๊ฐ ์ถ๊ธฐ๋ ํ๋ค. ์์ผ๋ก๋ ์คํํธ์ , ์ฐ๊ตฌ๋จ์ฒด ๋ฟ๋ง ์๋๋ผ ํ ํฌ์์ด์ธํธ๋ค๋ Generative AI๋ฅผ ์ด๋ป๊ฒ ๋ฐ์ ์์ผ ๋๊ฐ๋์ง ๋ณด๋ฉด ๋ ๋ค๋ฅธ ์ธ์ฌ์ดํธ๋ฅผ ๋ฐ๊ฒฌํ ์ ์์ง ์์๊น ์ถ๋ค.
Generative AI, ์ด๋ฏธ์ง ๊ทธ ๋ค์์?
์๋ ๊ทธ๋ํ๋ ๊ฐ ๊ธฐ์ ๋ฑ์ฅ์ ๋ฐ๋ฅธ ๊นํ๋ธ ์คํ ์(์ข์์ ์)๋ฅผ ๋ํ๋ ๊ฒ์ด๋ค. Ethereum, Spark, Bitcoin๊ณผ ๋น๊ต๊ฐ ์๋๋ ์๋๋ก Stable Diffusion ๊ด๋ จ๋ ๊นํ๋ธ ์คํ ์๊ฐ ๊ธ์ฆํ๊ณ ์๋ค. Ethereum๋ ์คํ์์ค์๋ค๋ ์ ์์ ๊ทธ ํ๊ธ๋ ฅ์ ์ฐจ์ด๊ฐ ๋๊ปด์ง๋๊ฒ ๊ฐ๋ค.
๊ฐ๋ฐ์, ๋์์ด๋ ์ปค๋ฎค๋ํฐ์์ ํฅํ๋ ๊ธฐ์ ์ ๋์ฑ ๋ ๋กฑ๋ฐํ ์ ์์๊ฑฐ๋ผ๊ณ ๊ธฐ๋๋๋ค.
์ด๋ฒ ๊ธ์์๋ ์ง๊ธ๊น์ง์ Generative AI ๋ฐ์ ๊ณผ์ ์ ์ดํด๋ณด๋๊ฒ ๋ชฉ์ ์ด์๊ธฐ ๋๋ฌธ์ ์ดํ๋ฆฌ์ผ์ด์ ์ด ๋ง์ด ๋ฑ์ฅํ ์ด๋ฏธ์ง Generative AI์์ฃผ์ ๊ธ์ด ๋์๋ค.
์ฅ๊ธฐ์ ์ผ๋ก๋ Generative AI๊ฐ ์ ์๊ธฐ๊ฐ, ๋ณต์ก๋ ์ธก๋ฉด์์ ์ฝํ ์ธ ์ ์ ๋น์ฉ์ด ๊ฐ์ฅ ํฐ ์์ญ์ ํ์ ์ ๊ฐ๋ฅํ๊ฒ ํ์ง ์์๊น ์ถ๋ค. ๊ทธ๋ฐ ๊ด์ ์์๋ ์๋ a16z์์ ์ ๊ณตํ ๊ทธ๋ํ์์ ํ์ธํ ์ ์๋๊ฒ ์ฒ๋ผ ์ฝํ ์ธ ์ ์ข ํฉ์์ ์ธ ๊ฒ์ ์์ฅ์ ๊ฐ์ฅ ๊ธ์ ์ ์ธ ๋ฐฉํฅ์ผ๋ก ์ด๋ ๊ฒ์ด๋ค.
๋ณ๊ฑฐ ์๋์ค ์์๋ โ์๋ณด์นด๋ ์์'๋ ๋ฅํ ํฌ ์์ฅ์์ ์ ๋ก ์๋ ํ์ ์ ๋ถ๋ฌ์ผ์ผ์ผฐ๋ค. ์ด๋๊น์ง ์ํฅ์ ๋ฏธ์น ๊น? ๋๊ตฌ๊น์ง ์ํฅ์ ๋ฐ์๊น? ์์ง์ ์์ธก์ด ํ๋ ์ด๊ธฐ์์ฅ์์ ๋๊ฐ key๋ฅผ ์ก์์ง ๊ณ์ ์ง์ผ๋ณผ ์์ ์ด๋ค.
๊ณง ๋ ์ฌ๋ฐ๋ Generative AI ๊ด๋ จ ์ฝํ ์ธ ๋ก ๋์์ค๊ฒ ๋ค.
ํ๋ ๋์ด ๋ ์๋ผ ์๋ณด์นด๋ ์์!