自 NovelAI 模型外洩後,技術人士分析該模型如何在二次元風格表現優異、普通愛好者則將目光投射到 Danbooru tag 庫上面。Danbooru 作為歐美知名動漫插圖分享網站,每張圖片都有標籤 Tags,用戶輸入想查詢的標籤以便在圖庫內縮小範圍、找到圖片。現在常見的關鍵詞 masterpiece, best quality, 1girl... 自這時起被越來越多人使用。
當更多人投入測試,AI生成的侷限性也陸續被察覺 :
10/8,發現要 Line AI 生成鮭魚洄游圖片,得到河中暢游的生魚片。
10/16,發現無論怎麼寫關鍵字,賽菲羅斯行走於水面上,絕對不會游泳。
10/18,發現要一張包含「少女」、「哭泣」、「蛋糕」元素的圖片,AI 生成了被蛋糕包覆只剩頭露出來而哭泣的女孩。
10/19,發現 AI 畫不出來正確的用筷子吃麵方式,樋口圓香風評被害。
(但本文讀下來殘害她風評的,是全部拿她做示意圖的作者吧)
學習資料不全面導致 AI 解脫人類思維輪迴、放下圖檔立地成梗,同時差不多這個時候,一群研究 NovelAI prompt 的用戶們公開了元素法典,記載各種敘述與相對應精美圖像,大家留意到負向提示重要性,然後便是那張上新聞的梗圖
AI生成頓時飛升至魔境,提示詞之謂"咒語"、寫敘述之謂"詠唱"、使用者之謂"咒術師"。原本認為只是網友調侃,但這些行話越傳越廣,連網路上某些正經討論也用起這些異世界轉生辭彙。如此「玄學」的「科技」,反差極大讓我快笑死,什麼時候提示詞輸入「龍鱗、反發、成雙之流星」可以把畫面斬成兩半,我才承認這些"尊稱"體現了在下孤陋寡聞有所不知的 AIGC 咒力~
不過玩笑歸玩笑,這段驚奇十月,讓我收穫最大的就是三段式 prompt。
作為以創作心中圖像為目的的摸索者,不太喜歡只專注在人物,忽略人物所處的環境。AI 不理解立體空間就算了、無法呈現正確透視就算了,但某些 AI生成作品要麼背景太單調、要麼場景與人物形象合不攏,還有那些背景長得亂七八糟的建築結構,不要每張圖都 Bokeh 就當沒事啊 !
所以我想盡可能掌握 AI 隨機生成的「人物」與「場景」,這牽涉無數次的嘗試與修改,如果提示詞想到什麼就寫什麼東拼西湊,假使我想替換其中某件元素,便無法直覺找出在什麼段落進行修正,三段式分段讓我加速測試流程。
另外開放所有人共同編輯的 Google 試算表" NovelAI 手抄本法術書"、分類歸納各種提示詞的網站"魔咒百科詞典",是這段期間協助我測試各種提示詞的好幫手,終於可以有效率找出慣用的構圖方法,這是眾人合作才得以跨出的步伐,集結工人智慧之光明,齊向人工智慧黑盒子提問。
10/20,Pixiv 宣布不排斥 AI 創作,並且 AI 作品將會與一般作品分開顯示排行榜。