何不問問ChatGPT?【2023/4/18】

何不問問ChatGPT?【2023/4/18】

更新於 發佈於 閱讀時間約 5 分鐘

早在 2022/12 ChatGPT 公布後,已有人開始思考:人們之所以難靠 AI 生成技術產生需要的圖像,在於 AI 邏輯異於人類思考模式。既然現在大語言模型能與人對話、完成自然語言交辦的簡單任務,


讓同為人工智慧的 GPT 替我們想提示詞,不就能讓 SD 產出符合需求的圖片?


初次看見這種說法,我並未產生多大興趣,當時若不親自進場繪製並圖生圖,提示詞幾乎可說是控制圖像生成符合需求的最後韁繩。這種唯一可控(?)的東西,還要推給生成式模型文字接龍,那人類到底在生成這張 AI 圖的過程中貢獻了啥?


當然人無法 24 小時維持靈活思緒,缺乏靈感需要隨機性相助時,其實 SD 有 Dynamic Prompts 工具能寫組合隨機元素的提示,搭配通配符 Wildcard 可以擴充自己電腦上的詞庫,拓展動態提示抽取詞庫中詞彙、做排列組合的可能性。儘管模型照不照提示跑,終究要看當初學了什麼資料,其他用戶檢驗過的詞,應該比語言模型靠機率推算出來的詞更有可信度?


但我沒靈感就沒使用 SD 的理由,並不需要靠動態提示找點子,直到隔年 4 月要替載下來的好多角色 LoRA 做參考圖......


直到這時,我才意識到問 ChatGPT 提示詞的真義:


人的時間寶貴,所以不要花時間動腦啊。


用 GPT 並非要幫自己完成什麼曠世鉅作,只是要把不重要的步驟省略掉而已。儘管在創作中,把發想過程略過也挺奇葩

最後我嘗試折衷的選擇:將自己試過、喜歡且產出穩定的提示給 GPT 當範例,請它依據我的架構,改寫我另一段提示,除提示外其他設定相同的情況下,將我寫的和 AI 寫的比較,看誰更有特色。


我參照網路說法,準備三個提示讓 GPT 記住,然後提出一個想要的情景,讓 AI 參考範例寫 prompt 。人物選定淺上藤乃 LoRA,由於她在手遊 FGO 某次夏日活動作為幽靈少女短暫出場,就發想人家在廢棄、積水的教室廢墟內徘徊的場景。


我的提示出圖結果:

raw-image
raw-image


GPT 改寫的提示出圖結果:

raw-image
raw-image


因為人家是幽靈少女,所以生成鬼片場景了?????


我檢查兩邊提示詞,發現 GPT 加入了情緒相關的詞彙,人物表情、整體風格,就被「恐懼」、「孤獨」、「沮喪」、「絕望」、「悲傷」等形容詞帶走了,若非 AnythingV3 為二次元模型,加上角色 LoRA 調和,GPT 提示生成的圖可能往驚悚方向呈現 :

沒加上人物 LoRA 的呈現

沒加上人物 LoRA 的呈現


要說不好嗎 ? 至少整體風格與色調具備一致性,需要多幾個案例測試。


接著是手遊蔚藍檔案角色陸八魔亞瑠 LoRA,曾在沙漠化的阿拜多斯自治區內大展身手,但光靠我的提示,很難讓她旁邊出現各式軍武 :

raw-image
連生成這類視角都挺難,若尺寸設定橫向,往往只會生成她的上半身得意臉

連生成這類視角都挺難,若尺寸設定橫向,往往只會生成她的上半身得意臉


GPT 改寫的提示出圖結果:

raw-image
raw-image


GPT 利用「落日」、「沙塵暴」提示詞,使畫面看起來沒那麼色澤鮮明,更符合實際情景。但加入的「軍營」、「廢墟」、「戰爭場景」提示詞通通沒出現,只填充字數降低人物在畫面中的比重而已。或許是 LoRA 的干涉導致其他要素難以出現 ? 人物敘述直接用 1girl 試試,我寫的提示出圖結果 :

人物很容易出現,但坦克很少見,軍事設施更是幾乎沒有

人物很容易出現,但坦克很少見,軍事設施更是幾乎沒有

GPT 改寫的提示出圖結果:

坦克權重高達 1.5 而必出現,結果 AI 寫的人物提示詞雖然不少,被坦克壓過去了

坦克權重高達 1.5 而必出現,結果 AI 寫的人物提示詞雖然不少,被坦克壓過去了


既然前面是沙漠,最後一站就爬雪山,日本漫畫《滑頭鬼之孫》裡的雪女角色及川冰麗 LoRA ,搭配喜馬拉雅的雪地佛塔景觀應該挺有詩意,所以我的提示出圖結果​ :

raw-image
佛塔幾乎沒出現,好在這張圖人物右側遠景有些

佛塔幾乎沒出現,好在這張圖人物右側遠景有些

GPT 改寫的提示出圖結果:

raw-image
佛塔又是大方的權重1.5,所以畫面中看得到

佛塔又是大方的權重1.5,所以畫面中看得到


要說誰的 prompt 比較好......終究見仁見智 :

  • 給重點提示詞 1.5 權重的豪邁或許值得借鏡,但這重量足夠把某些細節壓沒了。
  • 輸入情緒形容詞可更進一步影響圖片氛圍,但可能同時影響場景、色調、人物表情,若我希望用提示分別設定人物與場景,情緒詞彙反而是難以控制的因素。
  • 同樣是人工智慧,GPT 生成的提示詞,圖像生成模型未必能理解並產出相應元素。


所以人工智慧寫的提示或許可以生成令人目光一亮的單圖,但如果想把這種風格拓展為一系列圖片、進行特定細節微調,我認為後續修飾仍難以單獨依賴 GPT。

更重要的是我替角色 LoRA 做參考圖的目的,是為了找到該 LoRA 能在自己筆電上生成、最穩定且還算好看的用法。GPT 寫的提示有效性依然可能受各模型先天差異影響,把它納入我的工作流程,豈不是除了磨合 LoRA 與 Checkpoint,還得測試 Checkpoint 與 GPT 提示的差距 ? 導入 AI 結果替我多添了一個流程 ?


總該回歸初心,而我的初心是沒想法大不了關機。

也只有想傳遞什麼,才有動力繼續嘗試創作,

既然選擇將時間用在這,想法在選擇前早已完成了。


管他正邪,只問自心。

心不屈服的話,再遠的 prompt 你也想得到。



何必照抄 GPT?你能寫成任何風格。

avatar-img
Bsh的沙龍
3會員
47內容數
記錄我在 2022 年 9 月之後使用 AI 生成圖像的嘗試。 這個主題總有一天會沒東西好寫,那就走一步算一步吧...…
留言
avatar-img
留言分享你的想法!
Bsh的沙龍 的其他內容
如果說 SD 是創作的筆,各式模型就是供筆揮灑的墨水,要是 AI 創作的發展走向風格侷限,豈不類似越編越薄的「新語」辭典?
藝術家將情感訴諸作品,即便數十億人同樣睜眼、盥洗、出勤,他們從日常中提取,僅屬於自己的不凡。 但在程式開發,寫出“不凡”程式碼又不留註解與開發文件,後續維護很要命啊!
Stable Diffusion 讓單機生成圖像成為可能,既然在本機運行,產圖效率當然受設備影響。因此人們想到將計算直上雲端,Google colab 成為電腦不夠強的人也能試玩 AI 生成的救星。
藝術家顯然陷入困境,將作品公開是為了爭取曝光度與機會,現在反倒方便人工智慧學習,直到每個人都有機會產生具備你風格的作品。
既然 SEO 文章都建議這種編排格式,這次來友善一下 Google 的爬蟲,本文記載 2023 年 3~4 月期間,隨意向語言模型問過的其中三個蠢問題!
如果說 2022 年底是 AI 圖像生成技術的狂歡, 2023 年 3 月就是 AI 大型語言模型的盛宴,即使引領一切的是各大科技巨頭。
如果說 SD 是創作的筆,各式模型就是供筆揮灑的墨水,要是 AI 創作的發展走向風格侷限,豈不類似越編越薄的「新語」辭典?
藝術家將情感訴諸作品,即便數十億人同樣睜眼、盥洗、出勤,他們從日常中提取,僅屬於自己的不凡。 但在程式開發,寫出“不凡”程式碼又不留註解與開發文件,後續維護很要命啊!
Stable Diffusion 讓單機生成圖像成為可能,既然在本機運行,產圖效率當然受設備影響。因此人們想到將計算直上雲端,Google colab 成為電腦不夠強的人也能試玩 AI 生成的救星。
藝術家顯然陷入困境,將作品公開是為了爭取曝光度與機會,現在反倒方便人工智慧學習,直到每個人都有機會產生具備你風格的作品。
既然 SEO 文章都建議這種編排格式,這次來友善一下 Google 的爬蟲,本文記載 2023 年 3~4 月期間,隨意向語言模型問過的其中三個蠢問題!
如果說 2022 年底是 AI 圖像生成技術的狂歡, 2023 年 3 月就是 AI 大型語言模型的盛宴,即使引領一切的是各大科技巨頭。
本篇參與的主題活動
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機