讓詩詞活起來｜使用 Playground AI 將《終風》具象化

琳

2024/01/08閱讀時間約 6 分鐘

AI 繪圖蔚為風潮，生成工具百家爭鳴。基於對文學的興趣，加上對科技玩意的好奇心，筆者嘗試使用 AI 繪製古典詩詞的意境。本次選用詩經《終風》為發想素材，搭配免費版的 Playground Ai 進行創作，成品如下圖。

用 Playground AI 將《終風》具象化

製作時，提示詞經過多次更動，同時發現許多 playground AI 的使用技巧，個人覺得十分有趣。故撰文分享本次生成圖片的過程與心得。

跌跌撞撞的修正歷程

前置作業：分析詩詞情境

進入正題前，先介紹本次 ai 生成圖像時較為特殊的環節--分析詩詞情境。

以下為《終風》的原文：

終風且暴，顧我則笑，謔浪笑敖，中心是悼。

終風且霾，惠然肯來，莫往莫來，悠悠我思。

終風且曀，不日有曀，寤言不寐，愿言則嚏。

曀曀其陰，虺虺其雷，寤言不寐，愿言則懷。

使用 AI 生成任何東西前，對結果應有粗略的想像，並依腦海中的模樣設計提示詞 (prompt)。例如，「我想生成一間美式餐廳的 logo，中間要有一顆大漢堡、鮮豔的色彩，並且有復古的感覺」這時，提示詞可能會有 hamburger、bright color background、retro style......

現階段 AI 生成工具的提示詞仍以英文為主，若直接將文言文、古詩句等當作 prompt，很難得到理想的繪圖結果。本次具象化的過程中，筆者的作法是在腦海中繪製草圖，再根據這張草圖發想提示詞。那草圖的靈感來源為何呢？就是詩詞的情境啦！

詩意拆解過程涉及一些文學上的考量，此部分非本文重點，故先省略。簡而言之，筆者對《終風》畫面的想像是：在風雨交加的夜裡，一名年輕女性悲傷地處在閨房，思念著愛人，眼神黯淡且憔悴，有種哀怨的氛圍。

設計提示詞 (prompt)

將圖樣敘述拆分成一個個簡短、有意義的英文片段，即可做為最初的 prompt。以上一段的粗體字為例，經轉換後如下：

a beautiful woman, on bed, in boudoir, sad, looking outside window, stormy weather, blue grey style

若未指定，AI 將隨機生成各種族的人

這樣的敘述算是完整的，但按下 generate 前突然想到一件事--若未特別指定，多數的生成工具會自動產生不同種族、文化的情境。

筆者曾有經驗，在未特別指定文化的情況下，若想生成「一群人一起寫故事」的畫面，在 adobe firefly 中的生成結果便如左圖所示，有拉丁裔、非裔、混血兒等等。為確保本次圖片是圍繞中華古典文化而生，需多加入＂ancient chinese＂在提示詞中。

生成種子圖

鮮紅的服飾在憂傷氛圍下顯得相當突兀

AI 製圖沒有一定的準則或流程，不過我個人習慣先將大範圍的元素（如色調、構圖、氛圍）固定下來，再進行微調。這部分我稱為「生成種子圖」種子圖通常有不少細部瑕疵，不過乍看之下已達到最初對圖片的想像。

我們沒能力去理解模型如何解讀 prompt。種子圖的產出如訓練幼兒般，需不斷嘗試、感知，才能使自己的想像與 AI 的解讀緊密貼合。

以本次最初的 prompt 為例，第一次生成的圖片如左，雖吻合壞天氣、閨房、古典中國等要素，女主角卻多了股肅殺之感，且鮮紅服飾在憂傷氛圍中顯得相當突兀。

於是，我將 "red" 放入 negative prompt 中、同時調高 "sad" 的權重。再次生成的結果已非常接近我對種子圖的標準，遂使用同一組 prompt 生成數張圖，再選出瑕疵最少的一張進行微調。

選出瑕疵最少的作為種子圖

即便是瑕疵最少的圖，仔細審視後也不難發現需要修正的地方，如：女主角胸前的衣料過於單薄、天氣未達到風雨交加的狂暴程度、茶几上出現不符合中國古典文化的物件...接下來，將逐一說明如何微調這些瑕疵。

註1：本次生成圖片的 filter 皆採用 Ominous escape；model 則是選用 Stable Diffusion XL

註2：當下對女主角的衣服變得裸露感到詫異，後來發現 boudoir 這個詞除了閨房外，也有性感閨房攝影的含意

修改物件

首先，我想將女主角的衣服修正為較保守的樣式。選擇上方工具列中的畫筆，點選 "draw to edit"，大略描繪衣服的形式後，再輸入＂ancient chinese woman's clothes＂的提示詞，便得到了理想的女主角模樣。

合成圖片

同樣以 draw to edit 的手法增強窗外的風雨時，效果卻未如同想像中顯著。有的畫風與前景無法融合、有的根本沒增加半點雨滴或閃電。推測是細細的雨絲和不可測的光線，對模型來說較抽象，陽春的畫筆使用技巧也添增了生成的困難度。

其中幾幅失敗的窗外景象

上網爬文、看影片後，才發現一直沒活用 Playground Ai 中「合成圖片」的功能。靈光一閃，便另找空白處下 prompt：＂rainstorm view from window, countryside＂即生成一張張風雨交加的景象。選擇較為接近的風格、擷取其中一小塊。

大量產出風暴的影像，作為窗外區域之素材

當時選用上圖中左下角這張的左上方窗格，將其切割下來並水平翻轉，移動到種子圖的窗戶上（下方第一張）此時，兩張圖的窗框無法完美接合。為解決此問題，使用 Image to image 的功能，將圖像二次生成。在這一步中，沒有提供任何 prompt，並將 image strength 調高，以確保圖片與當前的樣貌相去不遠，結果如下方第二張。

註3：撰寫此文時才發現沒存到當下 image to image 後的版本，故上圖二是事後補生成的，與接下來的過程圖及成果圖稍有差異，但應不影響閱讀。

刪除物件

最後剩茶几上的物品了，本想再次嘗試 draw to edit 來更動影像，使西式風格用品替換成婦女梳妝用的鏡子。怎料，生成出的影像反覆出現帶有科幻感的不明物體，多次修正後仍未改善。（非常荒謬...至今仍想不出可能的成因）

反覆生成右下角的謎樣物件，令人好氣又好笑

被折騰得眼窩痠痛，最後捨棄這項花招。乖乖用橡皮擦把西式物件消去，留下樸素茶几表面。再次檢查後沒發現明顯瑕疵，決定為最終版本。

結語

看著心中的想法在螢幕成形，有種類似養成遊戲帶來的成就感；將先秦時代下的文學產物，與最新科技交雜揉和，彷彿瞬間有了翻轉時空的超能力。過程中，雖然有不少次咒罵模型是笨蛋的衝動，與它的交流頻率卻從未減少，或許下 prompt 這件事本身就有股魔力，使人深深著迷。

筆者玩生成式 AI 不到半年的時間，還有許多不熟悉的技能與思維，還請多多指教。也希望此文拋磚引玉，為各路 AI 詠唱大神提供一些新的創作靈感。

琳

留言0

查看全部

發表第一個留言支持創作者！

從 Google News 追蹤更多 vocus 的最新精選內容