更新於 2024/09/03閱讀時間約 10 分鐘

2024.AI 提示詞概論 ➀ 基本技巧|What the Prompt

(*大致內容與去年的版本一樣, 只是翻新並錄製了影片)

今天我們來聊聊 AI 生成圖像最重要的條件之一,關於 Prompt 的基本概念

Prompt 的中文可以翻作「提示詞」,目前普遍指的是你對 AI 輸入的文字要求。接下來為了方便各位也方便一下我,就統一講中文的「提示詞」。




你還記得,為了生成圖片而寫的第一串提示詞是什麼嗎?


最開始剛接觸到 AI 生成工具的時候,我沒有先做過什麼深入的了解,甚至連新聞都沒看多少,就點開了 Leonardo.Ai 的頁面。

相信應該有不少人跟當時的我一樣,看到一點消息就以為電腦已經發展出能夠跟人類產生自然對話的能力,知道我知道的,也知道我不知道的。

不過真的使用下去之後,非常快你就會理解到,nop, not even close。

AI 依然無法做到真正「理解」人類的語言,

它只是能夠產出人類可以「理解」的東西罷了


說真的,越是瞭解生成式 AI 的工作原理,越讓我聯想到會說話的鸚鵡

你覺得鸚鵡真的理解了複雜的人類語言嗎?
還是他只是把特定的聲音跟人類特定的反應做了連結?

鸚鵡尚且是有腦袋的生物,是能夠實際上看見這個世界、有自己情緒的動物,可 AI 不是,簡單來說,它就只是非常精緻複雜的數學模型

AI 真正在理解跟計算的,都不是人類的語言,它理解人類語言的方式也不是人類的方式。

人要能夠使用工具的前提是,你需要具備使用工具的知識。或者至少要有去學習的意願。如果你不學著怎麼去跟它溝通,用它理解的方式來提出你的要求,那麼得不到你想要的結果,也是合情合理吧。


這支影片面向的是 AI 算圖的新手、以及對提示詞該怎麼寫沒有原理上概念的朋友,以 Leonardo.Ai 的使用經驗為主,分享我自己從零開始學習寫圖像生成提示詞的心得,只談基本架構新手上路的方向,關於 AI 底層原理的部分會盡量簡單帶過。如果你對底層原理感興趣,可以回看我之前做過的擴散模型基本功


在開始前希望各位可以動動小手加入沙龍,走過路過不要錯過。感謝支持。🙏




基礎觀念

  • 用英文寫效果最好
    雖然現在很多平台,包含中國版 Leo 可以支援用中文來寫提示詞,但還是比較推薦寫英文。
    市面上的 AI 模型,基底的訓練幾乎都是以英文來進行的,所以除了少部分特殊詞之外,英文提示詞的生成效果幾乎可以說就是最好的。
  • AI 看不懂你說什麼
    AI 理解文字的方式,需要透過一個預先訓練好的文字編碼器 (text encoder) 把人類的文字轉換成 AI 看得懂的東西,而這個東西人類看不懂,AI 並不能用人類理解文字的方式來看懂哩咧工(嗶---)。
  • 提示詞寫法主要分為單詞片語自然語言兩派。
    個人偏向單詞片語,偶爾會混著用。
    自然語言就是像人類講話,帶有描述、修辭、語法等口語化內容。目前在 SDXL 之後發布的模型中,自然語言提示詞的表現能力是有顯著提升的。
  • 越靠前的提示詞權重越重,也就是說 AI 會更重視它。
  • 在靠前法則的前提下,提示詞仍然有天生權重的問題。
    這取決於各模型的訓練方式。天生就重的提示詞即使放在後段也不容易被其他詞吃掉。相反的有些輕的詞,在不調整權重的情況下,放排頭也不一定會出來。
  • 同一個提示詞在不同模型、不同採樣調度、不同 LoRA 等不同條件之下,會有不同的對應結果,因此需要明白提示詞沒有絕對萬用的標準版
  • 同樣是生成式 AI,語言模型 (e.g. ChatGPT) 和繪圖模型 (e.g. Stable Diffusion) 是兩碼子事,工作原理是不一樣的。
  • 各家平台的效果語法基本上不通用,模型本身不吃語法,語法是給平台建構的工作流程吃的,MJ 用 MJ 自己的,Leo 用 Leo 自己的,A1111 也就是我們常說的 SDwebui 也是用它自己的,使用前請詳閱各家公開說明書。🧐
  • 沒有訓練過的詞就不會有對應效果
    在模型中沒有資料的提示詞不具備意義,充其量只作為一個亂數,但是,這不會導致無法生成,並且仍然會對生成結果造成一定的影響,只是這個影響跟你預想的不一樣。
    簡單來說,AI 會自己跳過它看不懂(沒學過)的部分,類似於有邊讀邊沒邊讀中間。
  • AI 讀取提示詞有一定的長度限制,過長的提示詞後段內容容易被忽略掉。
    目前在 SDXL 系列模型中,長篇提示詞的表現能力也是有顯著提升的。


以上十點基本觀念可以幫助你在測試提示詞的路上少走很多彎路。
總結一下,新手剛開始可以使用的寫法:

用英文寫,重要的放前面,發現效果出不來的除了往前放,還可以透過平台語法來加權重,不要把提示詞寫成論文,也不要嘗試跟算圖 AI 對話。




學習軌跡

剛開始確實推薦先從抄襲(借鑑)別人的提示詞學起,這個階段就像是學書法時的臨摹字帖,學畫畫時的臨摹名畫。

但是抄,不能盲目抄,盲目抄的話寫提示詞的功力是不會進步的。

英文不是我們的母語,但一點點慢慢地記、慢慢地學,很快你就會發現自己不知不覺背下了很多單字。並且生在這個時代的我們,除了基本的翻譯工具,還有強悍的 ChatGPT 啊。

我最近就透過 GoingBus 合租平台訂閱了 GPT-4,透過合租的方式,訂閱價格變得非常低,現在當付費仔還能享受到幾乎用不完的 GPT-4o 對話次數,回答速度真的比免費版要快得多。
透過專屬連結和優惠碼「windbro」,訂閱費用還能再打九折,感興趣的朋友可以參考之前寫過的 GoingBus 使用教學!

除了 GPT 之外,還有各大串流媒體平台可以合租喔!

從修改別人的提示詞開始,把主體替換成你想要的描述,把背景替換成你想要的場域,把風格替換成你喜歡的風格。稍微有點熟練度之後,就可以試試看,自己從無到有寫出一段提示詞。 一開始不用直接寫超長,一點點加就好。




完善流程

總結基本概念,以下是我對新手寫提示詞的建議,也是我自己通常使用逐步完善提示詞的方式:

用英文書寫,單詞構成,先寫出簡單的主體、想要表現的技法、色調、氛圍等等,加上基本上有寫有保佑的 bestquality。
🔽
根據使用平台可接受的語法來添加語法,以 Leo 為例,在煉金術開啟的情況下,是可以透過括號來添加權重的。
到這一步我會先刷幾次,看我寫的東西有沒有按照我想的方式表現出來。
🔽
依據結果調整提示詞的前後順序,並增加更多細節元素,如反向提示詞、藝術家名稱、第二色調等。
🔽
更換模型、更換畫布尺寸、更換其他條件設置。刷圖比對結果,根據結果調整提示詞。




結語

寫提示詞的路子有很多,我並不是唯一正解,只是其中的一條路,雖然前面提到了 AI 終究是數學模型,但因為它足夠複雜,有時候確實會有某種體感上的玄學,因此不同的老玩家會有不同的偏方,在國際版我們稱之為 Secret Sauce

希望每個走過路過的朋友,在看完後,經過練習,都可以找到自己寫提示詞的風格。我的第一串提示詞真的是挖不出來了,目前可以找到最早的是:

(當初的成品, DreamShaper 3.2, 2023)

Prompt:
Art nouveau, Alfons Maria Mucha, clamp, centered, approaching perfection, dynamic, highly detailed, watercolor painting, light blonde hair, light blue eyes, western facial features, full body, wearing fantasy ancient Chinese costumes, dress like a hobo, one is westerners facial features, deep eye socket, overall color is relatively deep, stick weapon,
Negative Prompt:
(((2 heads))), duplicate, blurry, abstract, disfigured, deformed, cartoon, animated, toy, figure, framed, 3d, cartoon, 3d, disfigured, bad art, deformed, poorly drawn, extra limbs, close up, b&w, weird colors, blurry, watermark, blur haze, 2 heads, long neck, watermark, elongated body, cropped image,out of frame,draft,deformed hands, twisted fingers, double image, malformed hands, multiple heads, extra limb, ugly, poorly drawn hands, missing limb, cut-off, over satured, grain, lowères, bad anatomy, poorly drawn face, mutation, mutated, floating limbs, disconnected limbs, out of focus, long body, disgusting, extra fingers, groos proportions, missing arms, mutated hands, cloned face, missing legs

80% 靠到處複製貼上,那時候對 AI 完全沒有概念,英文也很爛。

現在回頭檢查一遍可以改掉的地方好多🤣,寫提示詞這件事有練習真的有差,現在的我也不會寫那麼長串的反向提示了,大部分時候甚至是不寫,或是只寫基本款。

修改後的:

Art nouveau, Alfons Mucha, watercolor painting, light blonde, blue eyes, full body, fantasy hanfu, (martial arts) Caucasian, bestquality




希望這個教學對你有幫助,有任何問題可以在影片下方留言。

可以的話,跟我分享一下你的第一串、或是可以回溯到的最早的 Prompt 吧!

下一回我們來分享一些基本常用的詞!

感謝各位收看。




🎉 GoingBus 串流媒體合租平台 🎉

省錢看片!和世界各地的用戶一起分攤訂閱費,用最低價格享受 Netflix、Disney+ 等熱門串流服務,還有 GPT-4!立即訂閱 GoingBus,輕鬆合租,一起省錢吧!

✨首購輸入優惠碼:windbro,再享九折優惠!✨

GoingBus首頁:https://goingbus.com?s=Huk4FaoU


分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.