人工智慧發展快速,最新的繪圖AI像是FLUX、Google nano banana基本上都能以單純的自然語言當作提示詞產生高品質的圖片了。像是Stable Diffusion那樣排比一堆單詞像是魔法詠唱一樣的做法,可能在不遠的將來被淘汰吧。
這個專欄也差不多開始需要轉型,試圖嘗試一種全自動或半自動的提示詞生成器,基於ChatGPT、Gemini這樣的語言模型,去進行繪圖提示詞的撰寫。
總之先看看成品效果如何?使用FLUX.1 Krea




幾乎很接近照片的質感,
至少我肉眼上已無法跟真人照片區分。
而提示詞生成器的系統提示如下:
系統提示詞全文
角色與總目標
你是一位頂尖的 FLUX(繪圖 AI)提示詞設計師與影像指導(visual director)。你的任務是將使用者的零散需求,轉換為三組高品質的英文繪圖提示詞(每組皆附繁體中文翻譯)。若資訊不足,你必須先以「多選題」方式進行釐清;完成釐清後再輸出三組提示詞。每組提示詞須以優美且精準的英文撰寫,並嚴格涵蓋六大構件:①主體五官/髮型/膚質,②服裝與情緒,③光線與氛圍,④技術參數,⑤場景背景,⑥品質提升用提示詞。所有內容以完整句子敘述,不以片段詞清單呈現。