讓詩詞活起來|使用 Playground AI 將《終風》具象化

2024/01/08閱讀時間約 6 分鐘

AI 繪圖蔚為風潮,生成工具百家爭鳴。基於對文學的興趣,加上對科技玩意的好奇心,筆者嘗試使用 AI 繪製古典詩詞的意境。本次選用詩經《終風》為發想素材,搭配免費版的 Playground Ai 進行創作,成品如下圖。

用 Playground AI 將《終風》具象化

用 Playground AI 將《終風》具象化

製作時,提示詞經過多次更動,同時發現許多 playground AI 的使用技巧,個人覺得十分有趣。故撰文分享本次生成圖片的過程與心得。

跌跌撞撞的修正歷程

跌跌撞撞的修正歷程


前置作業:分析詩詞情境

進入正題前,先介紹本次 ai 生成圖像時較為特殊的環節--分析詩詞情境。

以下為《終風》的原文:

終風且暴,顧我則笑,謔浪笑敖,中心是悼。

終風且霾,惠然肯來,莫往莫來,悠悠我思。

終風且曀,不日有曀,寤言不寐,愿言則嚏。

曀曀其陰,虺虺其雷,寤言不寐,愿言則懷。

使用 AI 生成任何東西前,對結果應有粗略的想像,並依腦海中的模樣設計提示詞 (prompt)。例如,「我想生成一間美式餐廳的 logo,中間要有一顆大漢堡、鮮豔的色彩,並且有復古的感覺」這時,提示詞可能會有 hamburger、bright color background、retro style......

現階段 AI 生成工具的提示詞仍以英文為主,若直接將文言文、古詩句等當作 prompt,很難得到理想的繪圖結果。本次具象化的過程中,筆者的作法是在腦海中繪製草圖,再根據這張草圖發想提示詞。那草圖的靈感來源為何呢?就是詩詞的情境啦!

詩意拆解過程涉及一些文學上的考量,此部分非本文重點,故先省略。簡而言之,筆者對《終風》畫面的想像是:在風雨交加的夜裡,一名年輕女性悲傷地處在閨房,思念著愛人,眼神黯淡且憔悴,有種哀怨的氛圍。

設計提示詞 (prompt)

將圖樣敘述拆分成一個個簡短、有意義的英文片段,即可做為最初的 prompt。以上一段的粗體字為例,經轉換後如下:

a beautiful woman, on bed, in boudoir, sad, looking outside window, stormy weather, blue grey style
若未指定,AI 將隨機生成各種族的人

若未指定,AI 將隨機生成各種族的人

這樣的敘述算是完整的,但按下 generate 前突然想到一件事--若未特別指定,多數的生成工具會自動產生不同種族、文化的情境。

筆者曾有經驗,在未特別指定文化的情況下,若想生成「一群人一起寫故事」的畫面,在 adobe firefly 中的生成結果便如左圖所示,有拉丁裔、非裔、混血兒等等。為確保本次圖片是圍繞中華古典文化而生,需多加入"ancient chinese"在提示詞中。


生成種子圖

鮮紅的服飾在憂傷氛圍下顯得相當突兀

鮮紅的服飾在憂傷氛圍下顯得相當突兀

AI 製圖沒有一定的準則或流程,不過我個人習慣先將大範圍的元素(如色調、構圖、氛圍)固定下來,再進行微調。這部分我稱為「生成種子圖」種子圖通常有不少細部瑕疵,不過乍看之下已達到最初對圖片的想像。

我們沒能力去理解模型如何解讀 prompt。種子圖的產出如訓練幼兒般,需不斷嘗試、感知,才能使自己的想像與 AI 的解讀緊密貼合。


以本次最初的 prompt 為例,第一次生成的圖片如左,雖吻合壞天氣、閨房、古典中國等要素,女主角卻多了股肅殺之感,且鮮紅服飾在憂傷氛圍中顯得相當突兀。

於是,我將 "red" 放入 negative prompt 中、同時調高 "sad" 的權重。再次生成的結果已非常接近我對種子圖的標準,遂使用同一組 prompt 生成數張圖,再選出瑕疵最少的一張進行微調。

選出瑕疵最少的作為種子圖

選出瑕疵最少的作為種子圖

即便是瑕疵最少的圖,仔細審視後也不難發現需要修正的地方,如:女主角胸前的衣料過於單薄、天氣未達到風雨交加的狂暴程度、茶几上出現不符合中國古典文化的物件...接下來,將逐一說明如何微調這些瑕疵。

註1:本次生成圖片的 filter 皆採用 Ominous escape;model 則是選用 Stable Diffusion XL

註2:當下對女主角的衣服變得裸露感到詫異,後來發現 boudoir 這個詞除了閨房外,也有性感閨房攝影的含意


修改物件

首先,我想將女主角的衣服修正為較保守的樣式。選擇上方工具列中的畫筆,點選 "draw to edit",大略描繪衣服的形式後,再輸入"ancient chinese woman's clothes"的提示詞,便得到了理想的女主角模樣。


合成圖片

同樣以 draw to edit 的手法增強窗外的風雨時,效果卻未如同想像中顯著。有的畫風與前景無法融合、有的根本沒增加半點雨滴或閃電。推測是細細的雨絲和不可測的光線,對模型來說較抽象,陽春的畫筆使用技巧也添增了生成的困難度。

其中幾幅失敗的窗外景象

其中幾幅失敗的窗外景象

上網爬文、看影片後,才發現一直沒活用 Playground Ai 中「合成圖片」的功能。靈光一閃,便另找空白處下 prompt:"rainstorm view from window, countryside"即生成一張張風雨交加的景象。選擇較為接近的風格、擷取其中一小塊。

大量產出風暴的影像,作為窗外區域之素材

大量產出風暴的影像,作為窗外區域之素材

當時選用上圖中左下角這張的左上方窗格,將其切割下來並水平翻轉,移動到種子圖的窗戶上(下方第一張)此時,兩張圖的窗框無法完美接合。為解決此問題,使用 Image to image 的功能,將圖像二次生成。在這一步中,沒有提供任何 prompt,並將 image strength 調高,以確保圖片與當前的樣貌相去不遠,結果如下方第二張。

註3:撰寫此文時才發現沒存到當下 image to image 後的版本,故上圖二是事後補生成的,與接下來的過程圖及成果圖稍有差異,但應不影響閱讀。


刪除物件

最後剩茶几上的物品了,本想再次嘗試 draw to edit 來更動影像,使西式風格用品替換成婦女梳妝用的鏡子。怎料,生成出的影像反覆出現帶有科幻感的不明物體,多次修正後仍未改善。(非常荒謬...至今仍想不出可能的成因)

反覆生成右下角的謎樣物件,令人好氣又好笑

反覆生成右下角的謎樣物件,令人好氣又好笑

被折騰得眼窩痠痛,最後捨棄這項花招。乖乖用橡皮擦把西式物件消去,留下樸素茶几表面。再次檢查後沒發現明顯瑕疵,決定為最終版本。

raw-image


結語

看著心中的想法在螢幕成形,有種類似養成遊戲帶來的成就感;將先秦時代下的文學產物,與最新科技交雜揉和,彷彿瞬間有了翻轉時空的超能力。過程中,雖然有不少次咒罵模型是笨蛋的衝動,與它的交流頻率卻從未減少,或許下 prompt 這件事本身就有股魔力,使人深深著迷。

筆者玩生成式 AI 不到半年的時間,還有許多不熟悉的技能與思維,還請多多指教。也希望此文拋磚引玉,為各路 AI 詠唱大神提供一些新的創作靈感。

琳
留言0
查看全部
發表第一個留言支持創作者!
從 Google News 追蹤更多 vocus 的最新精選內容