關於AI圖片生成創作的學習小總結

Andy
Andy’s Project 一百種對生活的觀察
9 min readFeb 21, 2024

製作篇

前言

我個人在製作AI圖片生成的時候,大概分為幾個重點(因為目前著重的重點比較多是以人或物件為主,所以這邊思考主要以畫面有人為主,較少純風景的討論),這裡是以Midjourney的生成為主(bing的Dall-e著重在文本,而且試了幾次人物樣貌比較單一),但關於一些基本的步驟(如V6與Niji的差異、混圖與以圖製圖的方式),我這裡不多做說明了。

生成方法與原則

大抵上,製圖基本會由基本要素開展,然後依照不同主題或project再做每次的微調,以下是我的習慣要素:

  1. 「角色描述」: 人物是什麼樣樣貌,穿著什麼樣的衣服,膚色、情緒、看鏡頭的表情。另外我的經驗是,如果你想要亞洲臉孔但是輪廓比較立體的話,我個人嘗試的結果,可以儘量用「混血」這個概念去做,人物呈現上會有比較不一樣的表現。(但大部分不會真的像混血兒XD)
  2. 「畫面描述」: 現場的畫面,背景有什麼,這裡可以有嘗試前中後景,透過詳盡的前中後景的分別論述,來做比較精細的設置。但如果畫面沒有太大的話,可以一般論述性的文字即可。(畢竟提示詞還是有上限的,這邊岔題可以設定提示詞的敏銳度: 如果調太敏感的話,可能會連看向「鏡頭」的指示,都真的給你跑出一顆鏡頭出來,這部分真的要試了)以下是一些範例:

Three grounds: Blonde woman in the foreground, people running frantically in the middle ground, alien space ships in the background, Kodak portra 800 — ar 16:9 — style raw

Two grounds: People in the middle ground, alien space ships in the background, Kodak portra 800 — ar 16:9 — style raw

Three grounds: People in the foreground, ferris wheel in the middle ground, buildings in the background, Kodak portra 800 — ar 16:9 — style raw

3.「視角」: 這裡我會假想自己是攝影師或導演,這部分會需要一點點對畫面角度的認識,以下是一些簡單的範例。當然如果你直接用鏡頭語言來說的話,有時候不需要特別描述這段。

Eye-level Shot — Eye-level shot;
- Low-Angle Shot — A low-angle shot taken from below;
- High-Angle Shot — A shot taken from above;
- Side Profile Shot takes a profile shot from the side;
- Shot from behind;
- Oblique Angle — Shot from an angle;
- Over-the-Shoulder Shot — Shot over the character’s shoulder;
- Off-Center Shot — a shot where the character is not in the centre of the frame;

接著可以嘗試不同的鏡頭效果與距離:

- Fish-eye — a fancy lens for interesting angles;
- Extreme — the prefix can be used to enhance the effect of said keywords.
- Macro — macro photography;
- Close-Up Shot — a close-up shot;
- Full Shot — Full frame, shows the subject in full screen;
- Wide-Angle Shot — Wide-angle shot;
- Establishing Shot — Establishing Shot, provides the surrounding context for the scene or subject;
- Aerial or Drone Shot — capture from a drone (you can specify the brand of drone, for example: Captured by DJI MAvic 3).

4.光源: 這我比較少用,但偶爾還是會用到,比如說光從前方打來、逆光、柔光…等等

5.影像風格與光圈焦距設定: 這裡是我蠻喜歡的部分,基本上如果有鎖定特定的影像風格,基本上畫面會鎖在一定的可能性。

*影像風格:

可以很隨性的「cinematic photo」、「photo-realistic」或甚至「japanese photography」都可以達到想像。但這裡我通常會先餵圖請ChatGPT分析我喜歡的特定風格他的構成是什麼?例如以下之前我嘗試做Edward Hopper的圖片,就先請GPT幫我分析他的特色,稍加潤飾整理以後,再到Midjourney中再透過此特色描述製作出類似的作品(以下是成品參考)

Edward Hopper原作
Edward Hopper原作
嘗試AI生成的 edward hopper風格

或是我很喜歡王家衛的風格,除了可以直接指定王家衛風格外,我通常就會在加上顏色設定跟漏光、慢快門的指令在其中。

王家衛風格的設定成果

*光圈焦段設定

這邊我習慣光圈會用f1.8 or f1.4,焦段視需要,因為我個人的喜好比較多都是一定的近照,因此,我通常都設定在20mm、35mm、50mm這幾個焦段比較多。midjourney的prompt算是聰明,基本上你設定焦段與光圈後,就不太需要再下realistic之類的語法。

由於我個人還蠻喜歡底片膠卷的風格,所以如果想要有點復古感的話,我也會放例如Kodak的什麼樣底片。

進階使用元素

這裡是透過以圖生圖的方式進行製作,目前Midjourney已有-sref的功能(Style Reference),這裡可以透過喜歡的圖片或照片進行一定的框架設定,再透過咒語將其生成出想要的樣貌。依照我目前嘗試過的案例來看,大抵上會在色調與人物風格上面抓取大約30%的輪廓,其餘還是會依照prompt的設定為主。這理會還蠻有奇幻的感覺,我自己目前還蠻喜歡這種嘗試的。(而且圖片可以不限定一張),有些部分作品,我也會先把不同圖片組合在一起看出現什麼樣子後再去做修正。

參考圖片
成品: 主體比較呈現在模特兒的妝容與神情上

學習篇

關於學習的部分的話,主要分為靈感來源以及分解元素的方式。也是在這段過程當中一點一滴的學習與認識自己喜歡的風格是什麼,進而也在思考為什麼喜歡這些東西。

靈感來源:

1.Midjourney Member Gallery

如果加入了midjourney的付費會員,會可以進到會員gallery,裡面有各式各樣的風格與演算非為你推薦的圖片,在哪裡可以參考不同網友在設定上的prompt與思考方式。同時也可以有點像Pinterest的使用方式,為喜歡的風格分門別類。

2.Pinterest

建立相對應以及想創作的模板,透過Pinterest的推薦,讓我知道自己想要的風格是哪些,想嘗試哪些想像。分門別類,也可以當作日後做為以圖生圖的資料庫。

3.攝影書與雜誌

雖然雜誌與攝影書感覺很old school,但是因為雜誌都有編輯去做處理,因此,在風格上也就會有一定的邏輯。而攝影書的部分,大抵上就是針對自己喜歡的攝影師風格去做分析。

4.IG的AI帳號

當我開始自創小帳號以後,透過Meta演算法的推薦,讓我除了生成的圖片外也有很多意想不到的後續應用以及其他AI工具的結合。例如AI動態生成的Runway、Pika,2D轉3D的leiapix,再透過原本Premiere與AE的一些基本技術,就可以轉化出很多意想不到的作品。此外,也有看到很多NFT的後續應用。當然,也有不少原本是攝影師後來同步在做AI圖片生成創作的,他們的觀點與分享,我也還在摸索當中。

元素分解:

這部分我主要透過ChatGPT以及Midjourney的describe功能,ChatGPT的風格解釋比較詳盡,甚至可以很有脈絡的解釋圖片的調性,我經常會蠻驚艷於他解讀的過程中看到我意想不到的結果,然後可以透過GPT請他轉換為圖片的Prompt再進行圖片生成,看差異性到哪裡。接著我再修改調整潤飾一些細節以達到我想要的效果。

MJ的Describe功能,比較多是在於觀察出MJ在分析圖片上的解構方式,多數比較不會是讓你思考與分析喜歡的風格是什麼,而且產生出的Describe甚至會與原本的圖片相差很大。

不過好處是他每次會有四種不同的切角,這四個切角當中,有些會是我上述的鏡頭語言、有些是攝影師風格,常常四種出來的畫面都遠比不上以圖生圖的效果。但是如此一來會讓你發現新的圖片風格,二來是更知道機器再看待畫面的思考邏輯。

而且,常常會有一些意想不到的驚喜,這些驚喜往往和你當初的目的大不相同卻可能會讓你更喜歡,甚至比一張圖一張圖、咒語一點一點慢慢嘗試還來得更讓人喜歡。

總結:

其實這一切都還剛起步,在應用上面還有許多不是很清晰的地方。而無論是哪項工具,目前都還有很多限制跟無法隨心所欲的地方。但對我而言,就像是可以實現夢境與想像的新可能。

這體驗算是過去前所未有的。

最後分享一下我的創作小帳號:

--

--