AI 時代必備工具,5 款文字生成圖片的 AI 工具推薦

Deep Dream Generator、Dall-E、Midjourney、Leonardo AI、Stable Diffusion

Chris Lee
工程隨寫筆記
6 min readMar 13, 2023

--

對這是 AI 畫的

AI文字生成圖片技術是一種基於深度學習的技術,可以自動根據自然語言描述生成相應的高品質圖像,導致近期越來越多人學習咒語(圖片文字描述 prompt)。

下面介紹幾個我覺得目前市場上功能性算好的工具或網站,並產製一張男性的白袍巫師圖來比較。

1. Deep Dream Generator

https://deepdreamgenerator.com

Deep Dream Generator 可以根據自然語言描述生成高品質圖像,同時提供了多種不同風格和效果,包括水墨畫風格、漫畫風格、素描風格等,方便用戶進行自由選擇。

該工具還提供了一些高級功能,如風格遷移、圖像分割等,讓用戶可以更加自由和靈活地控制生成的圖像。

每個人會有固定的免費額度,使用方式非常簡單,註冊、登入、打上關鍵字即可,對不熟咒語的麻瓜相當友善。

2. Dall-E

DALL-E 是由 OpenAI 開發的一個文字生成圖像的AI工具,它可以生成符合自然語言描述的圖像,並且在圖像生成的過程中可以實現對圖像的細節控制。

DALL-E 在 ChatGPT 這輔助下,可以讓不會唸咒語的麻瓜很快上手,他的風格跨度會比前面的 Deep Dream Generator 再大一點,但效果如何就見仁見智。

目前跟其他 OpenAI 產品一樣,一定的額度內是免費的,喜歡的可以嘗試看看。

Dall 的圖都有一種微妙特質

3. Midjourney

Midjourney 應該是最無人不知不人不曉的工具了,網路上看到很多很屌的圖,很高機率都產自這裡,缺點就是你要熟悉 discord 機器人的用法。

知名的discord產圖畫面

Midjourney 優點是生成的圖像品質高、細節豐富、並且支持多種不同類型和風格的圖像生成,而且還提供了一些高級功能,如風格遷移、多類型混合等,例如你點 discord 的 V1 就可以針對第一張圖繼續生成,缺點就是大家都會看到你的圖。

原則上 Midjourney 都是免費使用,但因為 discord 機器人有額度限制,用太多還是會被 ban 的喔。

是不是帥很多

4. Leonardo AI

近期相當火紅的 AI 產圖工具,某種程度來說,功能比上面 3 個健全,但學習曲線也高一點,註冊較為麻煩,需要等待邀請才可以使用,可能之後會正式開放註冊吧。

Leonardo AI 強就強在他保有 Midjourney 的功能,但是是用 web 的形式呈現,而且每個 AI 參數、生成細節都可以自由調整,對於詠唱不熟悉的人,也有輔助題詞的功能,對於想好好研究 AI 生成圖片,但沒有工程師背景的人來說,是很棒的首選工具。

5. Stable Diffusion

既然放在壓軸,就代表這是我認為目前最強大的工具,Stable Diffusion 不單單是文字產圖的技術,也是他的工具名稱,上面的 Online 版可以提供入門魔法師進行詠唱,如果你有一定的程式能力,我會建議你使用下面AUTOMATIC1111 的 Web UI 來玩,你會發現新大陸。

雖然會需要用到你的電腦資源(當然建議要有GPU),但好處是完全免費,你要生成幾張圖都不會有人收錢。

網路上也有人提供 Colab 的版本,但如果你要深入研究,建議你還是在個人電腦上學習,Stable Diffusion 的優點除了上面 4 個工具功能外,還能提供你訓練自己的模型,如建立自己的 LoRA 模型,讓你可以做出虛擬角色、或是 虛擬 Coser,天花板的上限非常高。

因為 Stable Diffusion 的功能博大精深,後續會出一系列說明 SD 的技術及應用方式。

從 2021 的 NFT 爆紅,創造對藝術家的新商業模式,到 2023 的 AI 產圖百家爭鳴,一個小學生就能在一夜間產製大量的圖片創作,藝術家的未來有非常多的挑戰。

要玩美少女夢不要懷疑,選 SD 就對了

--

--

Chris Lee
工程隨寫筆記

隱身在金融業的資料科學家,部分文章會在個人部落格唷 https://chrisnote.com/