說到AI詠唱,當然也不能跳過運用 生成對抗網路(GAN) 和 穩定擴散模型 (stable diffusion) 為基礎而生的圖像生成AI 平台。
關於 Leonardo.Ai
今天我們要實作體驗的
Leonardo.Ai,就是結合了生成對抗網路和穩定擴散模型的文本生成圖像平台,使用者可運用自然語言詠唱,就能快速生成具有不同風格美感的圖像。特別值得一提的是,Leonardo.Ai 宣稱,在使用者輸入的文本和素材都是使用者本身專有的資產前提之下,不論是免費或付費使用者,都可將在Leonardo.Ai 平台所生成的圖像作為商用。
Leonardo.Ai 目前的註冊是申請制,使用者需要輸入自己的 email 並等待他們的email 指示,按照指示加入Discord 平台後稍待個幾天,就會收到他們的 whitelisted 通知信,再用同樣的 email 登入 Leonardo.Ai 的網站即可開始使用囉。
進入 Leonardo.Ai 平台後,會注意到他們每日分配給免費使用者的代幣(image token),每次生成與處理圖像都會扣除代幣,隔天系統又會再重新分配新的150個代幣給使用者,每日大概可以生成150張 (768x768px) 的圖片;不敷使用也可以昇級成為付費的版本,月費在10~48 元美金不等。另外免費使用者生成的圖片都會被公開,不可採用隱密生成的方式。
除了自然語言詠唱之外,Leonardo.Ai 也提供了多種已完整校正(Finetuned)的模型可以選用風格生成圖像,對於我們這些詠唱新手來說特別地友善。 不管是光影對比強烈的藝術風格、RPG 遊戲的女神風、復古的像素設計風格、2.5D 等距像素(isometric) 風格或是可愛的藝術設計角色…等。都可以依照使用者想要呈現的圖像風格來套用模型。
實作開始!
我們挑選實作體驗的是精靈生物模型 (Spirit Creature),在這個模型之下有許多已生成的圖片範例,我們也可以點選既有的不同的圖片,參考學習甚至是複製詠唱指令。
按下了 Generate with this model 之後,會進入 Leonardo.Ai 的設定後台,在左側會有圖像的設定,包括了生成的張數、尺寸、比例。另外也可以決定詠唱指令(prompt) 的權重比,也就是完全符合詠唱指令的強度。同時,使用者也可以透過上傳想要表達風格的圖片來加強圖片生成的正確性。在視窗的中間則是輸入詠唱指令的設定區域與圖像生成的區域。
Leonardo.Ai 採用自然語言文本生成技術,所以詠唱的指令無論是英文、中文或是日文都是可以被接受的,但要注意的是,因為不同語言的結構和語意的不同,多少會對生成結果造成不同程度的影響。所以也許可以依需求,用不同語言測試和調整,確保生成的內容符合自己的期待。
我們首先來試試看用中文的方式詠唱,在 Type a Prompt 欄位輸入:
一隻可愛潔白又胖胖的長毛雪人,他圓圓的大眼睛裡有點點星光,背景是柔和的漸層色的雪地。
(也可以點選 Negative Prompt (負面影響指令)將不符合圖像生成期待的文本,像是:醜醜的,瘦的,短毛,黑色的,小小的眼睛,很多手指…等輸入,讓模型生成與提示相反的內容。)
接下來按下 Generate,使用4 個 代幣生成圖像。
看來詠唱的中文指令對AI 來說語意過於模糊,生成的圖片就不如預期,還十分怪異 🥴 。
嘗試了幾次中文似乎仍辭不達意後,我們參考既有圖片的模型改寫製作英文的詠唱文本,加入了解析度,畫質,景深和視覺風格…細節:
a creature, snowman, a furry, puffy, character in full view, analogous colors, glowing shadows, beautiful gradient, depth of field, clean image, high quality, high detail, high definition, Luminous Studio graphics engine (一個生物,雪人、毛茸茸、蓬鬆、全景角色、類比色彩、發光陰影、美麗漸層、景深、清晰圖像、高畫質、高細節、高解析度、Luminous Studio圖形引擎。)
這次的表現似乎好很多喲!
接下來點選滿意的圖片就可以下載、放大或去背圖片,放大圖片可以獲取更多細節。或是下載需要的圖片,再把圖片拉回自己習慣的圖像處理軟體修正細節、編輯色彩與調整尺寸...等。這對有製作高畫質與美感的圖片需求的人,也是很有效率的作法。
實作結論
Leonardo.Ai 因為是獨立的平台,相較於 Midjourney是較為友善的介面,另外每日分配給免費帳號的代幣也很充足,很適合詠唱新手嘗鮮測試。另外提供了校正完美的模型這個條件,的確十分的加分!讓喜歡創作生成圖像藝術的人,不需要代碼或特殊設定,就能用更友善的方式達成期待的圖像效果。
而對於本身是畫家或設計師的人來說,如果是擅長描述創作意像的創作類型者,也許也能從文本和意像生成的圖像中,找到很多創作的靈感或驚喜。另外Leonardo.Ai 其實也有所謂的訓練集設定,創作者也可自行上傳圖片來特製訓練自己的Ai模型,讓繪畫創意跳脫傳統的筆刷、畫具或製圖工具。
實測下來比較不如人意的,可能還是中文詠唱文本的結果仍不符合期待這件事。就算將英文文本中譯,其實也無法產出相同的效果。這是在大多數的圖像生成平台時,都有發現的情況,建議如果有生成圖像需求,目前還是使用英文文本比較合適。
最後還是要溫馨提醒,由於各國智慧財產權的法令規定多有所不同,目前生成圖像仍有侵害知識產權的可能,建議大家還是謹慎使用,公開使用圖像時,也應註明圖像生成平台來源為佳。