人工智慧取代畫師的時代來了！AI 繪圖平台 Disco Diffusion、Midjourney、DALL·E 2

史塔克實驗室

更新於 2024/10/05發佈於 2022/10/06閱讀時間約 16 分鐘

人工智慧取代畫師的時代來了！AI 繪圖平台 Disco Diffusion、Midjourney、DALL·E 2 的使用方法及心得

寫這篇文章，是因為明明現在許多AI自動生成圖片的平台

都不太需要大家寫程式了，但是卻好像沒什麼人幫大家整理

因為之後想跟更多人一起玩這種新科技，所以先來整理一下，未來推廣的時候也比較方便

對於這種可以自動生成插畫的科技，如果想聽聽看業界人是在想什麼的朋友

可以來聽看看: 「哈拉人工智慧」: 科技帶給繪畫、插畫、同人誌業界什麼樣的震撼? イラストレーター & どうじん feat. 定嵐.

最近玩了以下四款: Disco Diffusion、Midjourney、DALL·E 2、NovelAI

每一個平台都只要輸入關鍵文字，機器人就會按造關鍵字來產生逼真一張圖片。

下面就簡單地跟大家講解一下:

1. DALL·E 2

DALL-E模型最初於2021年1月5日由OpenAI發布。2022年4月，OpenAI宣布了新版本的DALL-E 2，它可以從文本描述中生成照片般逼真的圖像，另外還有一個允許對輸出進行簡單修改的編輯器。

根據OpenAI的公告，該程序仍處於研究階段，訪問權限僅限於小部分測試版用戶。該模型有時仍會犯一些人類不會犯的嚴重錯誤。[OpenAI稱DALL-E 2是一個「可以從文本描述中生成原創、逼真的圖像和藝術」的模型。

網址: https://openai.com/dall-e-2/

一開始註冊帳號之後，會請你用電話認證。以前還需要排隊，還有名額限制，現在都全開放了，很方便，只是有張數限制而已。

第一個月有免費50張，之後每個月有15張，超過請儲值。

進入介面之後，第一次玩這種AI生成器的人可能會愣住

不知道要打些什麼沒關係~ DALL·E 2 幫你設計了一個按鈕『surprise me』

會幫你產出一些範例文字出來

例如我下面骰出來的文字:

a macro 35mm photograph of two mice in Hawaii, they're each wearing tiny swimsuits and are carrying tiny surf boards, digital art

產出來的圖片就會像這樣有二隻老鼠在夏威夷並且穿著泳褲帶著衝浪板等等資訊。

那我也嘗試自己下一些關鍵字來生成圖片

a beautiful girl wear student uniform under the moon, digital art

如果不下『digital art』的關鍵字就會有機率產生出類似真人的圖片出來

那我有聽說DALL·E 2 在擬真的圖像表現是比較好的

所以我下了一組關鍵字是
Dinosaur fight with tiger, volcano eruption
結果非常的失敗不知道是不是因為沒有真實的恐龍關係

所以我只好把想像力縮減成

老虎跟獅子決鬥

lion fight with tiger in the jungle 效果也是普普通通第三章有點Fu拉其他真的是挺慘的

跟前面『digital art』類似如果下了『unreal engine』關鍵字

就會有比較擬真的圖片出現像我叫獅子去開特斯拉

就有比較多奇怪有趣的照片出現

2. Midjourney

Midjourney是一個獨立的研究實驗室，該實驗室專門研究的人工智慧的應用，這一款應用可以根據文本描述創建圖像，類似於OpenAI的DALL-E和開源的穩定擴散。

該工具目前處於公開測試階段，在2022年7月12日進入測試階段。

之前 Midjourney 跟 DALL·E 2一樣，要邀請碼才能使用，但現在只要加入他們 Discord 頻道，就能直接試用了。

目前都是全免費的，雖然他們好像有寫說，產生出來的圖片不能商用，商用需要另外付費，但是誰知道呢....

網址: https://www.midjourney.com/home/

進到官網之後，點擊 Sing In with Discord 先註冊，然後再按 Join the beta 加入測試計畫：

接著就會進到 Midjourney 的 Discord 頻道裡面，目前裡面有很多成員，因此常常會有訊息。有任何使用上的問題，可在 member-support 裡面發問，而要 AI 自動運算圖片的話，請進入 newbies 系列的聊天頻道，任何一個都可以：

Midjourney 的優點就是你不會愣住

只要近來頻道大家打的關鍵字都一覽無遺

可以參考人家打的關鍵字去調整

這邊要注意的是一定要在聊天輸入欄位中，輸入 /imagine 才可以開始使用

很重要這邊要注意不然只是一般的聊天而已XD

那我就一樣來一個獅子開特斯拉

感覺互動性真的少很多，Midjourney 特別的地方在於

生成出的圖片會有四張，下方還有 U1、U2、U3、U4 以及 V1、V2、V3、V4 功能。左上為 1、右上為 2、左下為 3、右下為 4。

U 是 Upscale 的縮寫，當你滿意這張圖片時，就可以用這功能取得大圖片，V 是 Variation 的縮寫，會根據這張圖片再繼續下去延伸變化。

最右邊圖示則是重新運算，按下去之後可以得到新的四張圖：

我選擇 V2，它就會以由上那張圖片再下去延伸變化出四張：

案到滿意的圖片之後，選擇自己想要的按下 Ux可以精緻化那我選U2跟U3

也分享一下當下其他使用者的作品給大家看一下：

queen elizabeth and princess Diana laughing and having tea

white hair, man, anime

8k «hot scarlet - haired girl» revealing seexualised scarlet-skinned girls body, «gold scarlet cyberpunk dress», cyberpunk, «Rubens» «roberto ferri» «Adolphe Bouguereau», «bouquets of flowers», lightning, neon, «Chiton», face, crystal, silk, jewelry emerald diamond iceberg, the milky way, planets, a parade of planets, «wreaths of flowers» ultra realistic ultra detailed cover photography shore volumetric light realistic,

我看到一些關鍵字之後，也想玩一下動畫，真實的關鍵字

one piece, luffy ,anime

結果滿酷的 是奇怪的魯夫ＸＸＤＤＤＤＤ

3. Disco Diffusion

Disco Diffusion 是一個人家寫好的線上程式碼，沒有包裝成簡單好用的平台。

但Diffusion 應該很多變體，不過我們介紹open soure，雖然入門門檻會比上面二款

稍微難一點點，但是精細度跟可動性比上面二款多，如果是會寫程式的朋友感受應該會更多。

那雖然是程式碼，但其實也不用安裝任何軟體，在科技的進展之下，有瀏覽器就能執行。

喔對了~還有你的雲端硬碟要有至少2G的空間.....

程式碼網址:

https://colab.research. Google .com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb

Step1：儲存副本

連結裡面的程式碼是公開給所有人使用的，沒有編輯權限，所以要先存一份副本到自己的
Google 硬碟，操作如下：檔案 → 在雲端硬碟中儲存副本。

Step2：設置參數

程式初學者應該是看不董這一大串的東西，所以我這邊會簡單介紹一下。

找參數的方法，就按下ctrl + s 進入瀏覽器搜尋，去找參數的關鍵字進行修改就好了。

Step2-1 找到『3. Settings』

如果是被縮小起來的，按一下中間那些文字就會打開了[N個隱藏的儲藏格]。

打開之後看到右邊最上面三個參數。

batch_name：資料夾的名稱，產生圖片會放在這個名稱的資料夾裡面。

steps：迭代步數，一般來說數值越大越精細，但花的時間會更久，在玩的時候不能關電腦，

所以第一次使用建議保持在 250，熟練之後再考慮 500，甚至 800。

width_height：圖片的尺寸，數值必須是 64 的倍數。初次使用非常不建議設置大尺寸，

不僅更耗時，還會因為記憶體不足，導致出錯。我自己會使用 [1024, 512]。

Step2-2 找到『Extra Settings』:

最上面的參數

intermediate_saves：儲存次數，這決定產生多少張過程圖，一般設置為 5。

Step2-3 找到『Diffuse』:

display rate：更新頻率，用來預覽產生結果。初始設置是20，每 20 格刷新一次進度，

其實也可以設定大一點，因為中間都是沒用的圖片，但可以看到電腦跑的過程，也是很有趣。

n_batches：這個數值決定了 AI 最終產生多少張圖，如果要拿來發社群九宮格，可以設定9

那想快一點拿到的人可以設定1或2就好。

Step 3 打入關鍵字

終於到這個環節了.....其他二款就是直接打關鍵字就可以玩了，Disco Diffusion 就是比較麻煩點

一樣用 ctrl + s 搜尋『Prompts』，這邊注意一下因為這個關鍵字不少，沒寫過程式的朋友

稍微要留意一點。

程式碼一開始給你的關鍵字是

「A beautiful painting of a singular lighthouse,

shining its light across a tumultuous sea of blood by greg rutkowski and Thomas kinkade,

Trending on artstation.」, 「yellow color scheme」

簡單分析一下，可以看到裡面有一些有趣的關鍵字，

藝術家：by greg rutkowski and Thomas kinkade

畫風：Trending on artstation （知名藝術社群 Artstation 上的流行畫風）

顏色主題：yellow color scheme

就像我們前面玩的可以下一些特別的關鍵字去讓圖片生成自己想要的風格。

我就先沒有改變，然後點擊執行

Step 4 執行

點擊：執行階段 → 全部執行

然後....就等吧

p.s 在執行的過程中，不能關閉電腦喔不然就沒了

最後的東西會在你的雲端硬碟最外層可能會跑出一個AI

裡面會有三個資料夾

分別就是輸出的圖片、初始圖片、模型

因為都把程式碼給你了，很多東西好好吞下。程式模型就1.28G

圖片大小因為前面設定沒有很大，所以都還好

那範例的東西畫出來就長這樣

一樣我讓程式去跑獅子開特斯拉

a lion drive a tesla

跑出來結果如下

怎麼樣我就不好說了.......

結論:

其實還有一款NovelAI，因為他一開始就要付錢所以我這邊就先沒測試了

如果要說感想的話 DALL·E 2 給我的感覺是真的會把每一個【名詞】的關鍵字畫出來之後作互動，
這款是唯一一個我看到獅子有趟在車子裡面，讓我感覺有在【開車】drive 的。

Midjourney 畫出來至少東西就是東西沒有互動，但也還好就是穩穩畫出來，沒什麼特別的感覺，但多人同時在上面玩，靈感就會比較多，滿有趣的，很像在玩線上遊戲。

也可能是因為我關鍵字下得比較少，不太精確? 只有獅子特斯拉

所以Disco Diffusion 給我就有種獵奇的感覺，像是下面這樣，靠邀!

有Musk的頭長在獅子上面......這是什麼新型奇美拉(怕)

每一款平台我覺得都是很需要下足足夠的關鍵字，才能夠生成好的圖片，尤其是Disco Diffusion….. 所以DALL·E 2會給你一些提示，Diffusion給了我們一個範例，而Midjourney則是使用者都在上面交流。

對於這種生成圖片的工具，我認為在未來真的是一種趨勢。

未來AI(電腦)生產的作品又高速又高品質可能會逐漸取代某些作品，但是人類藝術家的創作也不會消失。

甚至可能有新的職業產生，像是如何訓練AI畫出符合使用者需求(滿意)的作品，不然就會像我一樣，產生出一隻有Musk頭的獅子。

所以要怎麼寫好關鍵字，也是一門學問，像是國外已經有很多人在研究關鍵字了

https://weirdwonderfulai.art/resources/disco-diffusion-70-plus-artist-studies/

藝術家、風格隨你挑選

如果還不滿足，可以去 Disco Diffusion 的 Discord 社群聊聊天

https://discord.gg/msEZBy4HxA

網址不知道為什麼之前有改版過，至少目前(2022/10)上面是可以用的。

跟Midjourney一樣，有一個Discord 讓大家討論，但不像那邊這個雜亂，Diffusion 的 Discord

大家放出來的圖片是測試完的，會美觀許多。如果我沒有把那隻Musk奇美拉丟上去的話XD

大家可以在Diffusion 的 Discord 跟其他使用者討論如何產生更好的效果？如何寫好描述詞，

還有參數設定等等.......

另外這些AI生成的作品也可以當成插畫家取材靈感的工具。

大致上的結論是科技往前走的同時，該領域的業者也需要慢慢適應跟接納還有學習、進步，畢竟科技的進展是往前走的是趨勢沒有人能夠阻擋。所以大家一起玩玩看吧!

好啦，以上就是簡單的感想，還有簡易的操作流程。如果需要討論的朋友，在歡迎來信，留言。

如果大家喜歡我們文章，可以用一杯咖啡的金額贊助我們
讓我們更有動力創作～ 斗內連結：https://bit.ly/3qvdV4C
或者在方格子贊助即可
也歡迎大家來我Podcasts看看:
Apple: https://reurl.cc/D63Dz6
SoundOn: https://reurl.cc/n0OXad
Spotify :https://reurl.cc/Z71LrA

留言

留言分享你的想法！

史塔克實驗室的沙龍

113會員

94內容數

史塔克音近Stock，我們是一群喜歡研究股市市場並且利用機器學習分析的資料科學家，我們最常使用到Python來做量化投資，研究了一段時間的財經跟程式，希望能把我們自己分析的分析成果，和大家一起分享看看，並且和大家在這一條漫長的路一起學習成長！

史塔克實驗室的沙龍的其他內容

2024/10/13

2024年倒數兩個月：台積電與ETF選股機器人表現解析

2024年只剩下最後兩個月，九月份ETF選股機器人的績效為-0.5%，而0050的績效則達到了9.8%。正如我們上週提到的，在台積電的帶領下，0050表現相當亮眼。許多分析師認為，台積電於10月17日的法說會，加上美國降息後的資金行情，有可能為台股帶來進一步的增溫。降息效應與籌碼觀察

2024/10/13

2024年倒數兩個月：台積電與ETF選股機器人表現解析

2024/02/21

裁員衝擊下的科技行業：解析背後的趨勢與影響

近期，科技業裁員消息不斷，裁員潮席捲各大知名企業，成千上萬的員工面臨著失業的風險。這不僅是一場公司內部重組，更是一場對整個行業結構的巨大挑戰。今天，我們會來聊一下這個主題，以及它對當前的失業率和未來的就業趨勢可能帶來的影響。請緊跟我們的節目，一同來了解這個為人們帶來焦慮的問題。網路通訊設備大

2024/02/21

裁員衝擊下的科技行業：解析背後的趨勢與影響

2024/01/30

美股收紅 #標普500指數改寫歷史新高中國經濟遇到了大麻煩

#美股收紅 #標普500指數改寫歷史新高 #中國經濟遇到了大麻煩現在是怎樣，直接二個世界嗎？美國最近股票漲成這樣，中國爛成這樣，還好我沒去接騰訊...而且華爾街日報還直接有一篇「Americans Are Suddenly a Lot More Upbeat About the

2024/01/30

美股收紅 #標普500指數改寫歷史新高中國經濟遇到了大麻煩

看更多

你可能也想看

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

每年4月、5月都是最多稅要繳的月份，當然大部份的人都是有機會繳到「綜合所得稅」，只是相當相當多人還不知道，原來繳給政府的稅！可以透過一些有活動的銀行信用卡或電子支付來繳，從繳費中賺一點點小確幸！就是賺個１%~2%大家也是很開心的，因為你們把沒回饋變成有回饋，就是用卡的最高境界所得稅線上申報

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

科技巨頭解碼

NVDA 25Q1 財報 - 扣除中國因素，輝達的前方仍然沒有烏雲 | #276

全球科技產業的焦點，AKA 全村的希望 NVIDIA，於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1，實際日曆期間為今年二到四月)，交出了打敗了市場預期的成績單。然而，在銷售持續高速成長的同時，川普政府加大對於中國的晶片管制......

#NVDA#NVIDIA#輝達

2025/06/18

科技巨頭解碼

NVDA 25Q1 財報 - 扣除中國因素，輝達的前方仍然沒有烏雲 | #276

#NVDA#NVIDIA#輝達

2025/06/18

美股 Insight

6月Fed會議：略為鷹派收斂2026、2027年降息預期，繼續維持高利率更長時間的觀望態度

重點摘要： 6 月繼續維持基準利率不變，強調維持高利率主因為關稅點陣圖表現略為鷹派，收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變，強調需要維持高利率是因為關稅：聯準會 (Fed) 召開 6 月利率會議

#Fed#聯準會#美股

2025/06/18

美股 Insight

6月Fed會議：略為鷹派收斂2026、2027年降息預期，繼續維持高利率更長時間的觀望態度

#Fed#聯準會#美股

2025/06/18

Dodson的沙龍

【週報新聞】 | 3款設計師可能會討厭的AI繪圖工具。

Midjourney MidJourney 是一個 AI 繪圖產生工具，可根據使用者透過描述，利用文字描述風格、題材、場景等關鍵字，就能透過 AI 快速產生對應的視覺作品。 DALL·E 2 DALL·E 2 是由 OpenAI 開發的 AI 圖像產生器，根據文本描述創建圖像和藝術形式。它展示了擴

#AI繪圖#Instagram#OpenAI

2023/06/26

Dodson的沙龍

【週報新聞】 | 3款設計師可能會討厭的AI繪圖工具。

#AI繪圖#Instagram#OpenAI

2023/06/26

技術PM路易斯的沙龍

淺談AI繪圖工具 — 好用的幾個AI繪圖工具介紹與比較

對於還完全沒有AI繪圖經驗的你，該怎麼開始呢? 很簡單，就是開始”玩”! 先從動手開始隨便玩，讓想像力帶著你到處跑，在今天這篇文章裡面我會把幾個比較熱門的AI繪圖網站/工具介紹給你，你可以不要有任何心理壓力的開始玩玩看，看看能得到什麼有趣的結果。

#AI繪圖#OpenAI#繪圖

2023/05/16

技術PM路易斯的沙龍

淺談AI繪圖工具 — 好用的幾個AI繪圖工具介紹與比較

#AI繪圖#OpenAI#繪圖

2023/05/16

恰恰的沙龍

AI繪圖近況、各家優劣與操作介紹

目前的三大主流(程式)大概是：Midjourney、Stable Diffusion、DALL-E (Bing)，以下分別介紹：

#AI繪圖#Bing#AI

2023/04/14

恰恰的沙龍

AI繪圖近況、各家優劣與操作介紹

目前的三大主流(程式)大概是：Midjourney、Stable Diffusion、DALL-E (Bing)，以下分別介紹：

#AI繪圖#Bing#AI

2023/04/14

Dodson的沙龍

【AI 風潮】｜你該怎麼看待「20 張美女圖測試」？｜#Midjourney

前言　　Midjourney 是一款近期受歡迎的文字轉圖片 AI 服務，使用者只需要用 Discord 聊天應用程式，就能與機器人溝通，並創造出腦中所想的圖案。　　簡單的流程就是使用者提供文本輸入後，機器人會找到與描述相匹配的圖片，並以藝術形式詮釋它們，創建出獨特的圖像。　　Midjo

#OpenAI#機器人#測試

2023/03/02

Dodson的沙龍

【AI 風潮】｜你該怎麼看待「20 張美女圖測試」？｜#Midjourney

#OpenAI#機器人#測試

2023/03/02

陳穩生活恆穩人生

DALL•E 2: OpenAI 製圖失敗案例及原因—免費繪圖有限，請不要浪費！

DALL•E 2為我們提供了「可以將文字轉換成現實影像和抽象畫作」的人工智慧繪圖（算圖）軟體。我們可以輸入非常精確的指令，由軟體為我們繪出作品。

#Dalle2#AI#AI繪圖

2023/02/18

陳穩生活恆穩人生

DALL•E 2: OpenAI 製圖失敗案例及原因—免費繪圖有限，請不要浪費！

#Dalle2#AI#AI繪圖

2023/02/18

陳穩生活恆穩人生

DALL•E 2: OpenAI 製圖，將文字轉換成現實影像和抽象畫作—創作過程及靈感分享

「可以將文字轉換成現實影像和抽象畫作」的人工智慧繪圖軟體。我們輸入指令，軟體為我們繪出作品。由簡單到複雜，將小圖再擴大的過程分享！

#OpenAI#畫作#創作

2023/02/15

陳穩生活恆穩人生

DALL•E 2: OpenAI 製圖，將文字轉換成現實影像和抽象畫作—創作過程及靈感分享

「可以將文字轉換成現實影像和抽象畫作」的人工智慧繪圖軟體。我們輸入指令，軟體為我們繪出作品。由簡單到複雜，將小圖再擴大的過程分享！

#OpenAI#畫作#創作

2023/02/15

史塔克實驗室的沙龍

人工智慧取代畫師的時代來了！AI 繪圖平台 Disco Diffusion、Midjourney、DALL·E 2

人工智慧取代畫師的時代來了！AI 繪圖平台 Disco Diffusion、Midjourney、DALL·E 2 的使用方法及心得寫這篇文章，是因為明明現在許多AI自動生成圖片的平台都不太需要大家寫程式了，但是卻好像沒什麼人幫大家整理因為之後想跟更多人一起玩這種新科技，所以先來整理一下，未來

#程式#獅子#人工智慧

2022/10/06

史塔克實驗室的沙龍

人工智慧取代畫師的時代來了！AI 繪圖平台 Disco Diffusion、Midjourney、DALL·E 2

#程式#獅子#人工智慧

2022/10/06

科技巨頭解碼

Midjourney畫作打敗人類畫家！人類全面被人工智慧取代的時代即將揭幕？| 科技巨頭解碼#137

在過去兩周，有一則科技新聞，相當程度的搶佔了我的注意力 – 那就是在美國科羅拉多州，有一個遊戲公司的員工，利用AI 圖像引擎 Midjourney，生成了一個圖像作品，並且用這個作品在一場藝術比賽中成功拿下冠軍。很多人開始擔心，是否未來插畫家與設計師的工作即將岌岌可危，當 AI 能夠做出比人類創作更

#AI#人工智慧#創作

2022/09/22