欲善其事,先利其器【2022/10】

更新於 2024/11/19閱讀時間約 4 分鐘

2022 年 10 月是創新與挑戰並存的月份,人們進行天馬行空的測試,投石問路功不唐捐,都是疊起人類邁向 AIGC 領域深處的墊腳石。但不知因為抽卡過程充滿趣味性,還是樂於嘗試的人們多少抱持娛樂態度在玩 AI 圖像生成,某些網上分享的範例讓我滿頭問號。


它們未免太長了吧???


若沒特地設置權重,Stable Diffusion 會依提示先後順序安排生成的圖像,調整前面幾個提示詞,可能大幅更動整體構圖與組成。如果單就這個原理推論,提示詞自然越精煉越好,而且使用者最好先對畫面布局/重點元素有基本想法。


然而或許是被那張超長詠唱梗圖影響,AI 生成彷彿也是力大磚飛,圖片不夠完美就 4K、8K、16K 一併塞進去讓它更美,雖然就算疊到 506K,哇塞華氏 451 度紙張燃點,AI 生成多少像素的圖仍舊看你的長寬設定而不是提示詞寫什麼。那段時間尋找網路分享,嘗試在自己筆電重現,總會看到某些揚揚灑灑好似展現分享者經綸滿腹的提示"文稿",的確生成出繁複細緻的精美圖片,仔細比對內文與圖像卻發現其中諸多部份無相關性。


換言之就是電子汽水啊,會讓 prompt 虛胖,用來抽卡很爽。


但對困於 AI 隨機性一個月的我,prompt 與出圖結果沒啥關聯性,實在不是很爽的事情。我越少參考 Reddit/Stable Diffusion 版上帖子,轉向針對共享資料內的特定「單詞」進行單獨測試,這不會帶來重大變革,偏向盤點現有資源,確認哪些二次元角色只要單獨輸入姓名,Novelai 模型即可生成相應人物形象?從東方project 到 FGO、甚至到哈利波特,如果生成模型會受學習資料限制,那作為一名使用者,想發揮最大功能就得先拿捏模型極限。

Novelai眼中的依神女苑

Novelai眼中的依神女苑

Novelai眼中的瑪艾露貝莉·赫恩

Novelai眼中的瑪艾露貝莉·赫恩

Novelai眼中的四季映姬

Novelai眼中的四季映姬


為何尋找有效的人物提示詞?倘若輸入一個詞彙就能表現特定角色,表示我不再需要輸入更多描述體態、穿著的提示詞,如此可以提供更多空間進行場景、動作或其他提示詞的測試。因為 Stable Diffusion 默認有效 token 長度只有 75,超出了這個範圍,無論寫得多天花亂墜都派不上用場。


token 是語言模型裡用數字表現語意的最小單位,不完全等於單詞,受 AI 模型認知影響。若發現沒有學習過的單詞,AI 會將其繼續拆分,直到出現自己可以理解的單位。所以寫篇完整文章丟進 SD 當提示詞,可預見介係詞、連接詞之類不重要的部分也會被劃進 token,難怪 AI 生成圖像會與長文提示詞關聯性不大。


闔上筆電時,常埋怨網上 prompt 怎麼往往無視 75 token 限制,難道大多數人真的只是在玩嗎?隨著情況持續,一股感受油然而生 :


不對勁。


有些提示並非文章格式,且內容與生成圖像相關,但長度怎麼看都必然超出 75 token?


不對勁。


若長提示詞趨勢是缺乏概念的普通民眾湧入造成,為何竟少看見專業人士留言引導群眾?


不對勁。


終於無法按捺好奇心,檢視這些提示詞除了文字本身以外的其他係數。發現 A1111 開發的 Stable Diffusion webUI,在更新中移除了長度限制,可以分組處理超出 75 token 的提示,提升人類輸入對於 AI 的引導能力。


小丑竟是我自己,看來該換工具了。


avatar-img
3會員
25內容數
記錄我在 2022 年 9 月之後使用 AI 生成圖像的嘗試。 這個主題總有一天會沒東西好寫,那就走一步算一步吧...…
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Bsh的沙龍 的其他內容
2022 下半年的 AI 圖像生成技術這麼難用,為什麼還能掀起熱潮? 因為 AI 產的怪圖太怪了。
自 NovelAI 官方發推提及自家 AI 模型學習 Danbooru 圖庫後,有網友抓包 AI 餵太多帶有繪師簽名的圖片,連自己生成的圖片都出現簽名了。但這大概不是人工智慧覺醒黎明。
自 NovelAI 模型外洩後,技術人士分析該模型如何在二次元風格表現優異、普通愛好者則將目光鎖定在 Danbooru tag 庫上,是為大 prompt 時代。
因為 SD 慢慢跑也是跑得動,我一向懶得關注線上付費 AI 圖像生成資源,但當時仍有件事讓專注於本機的我注目,也就是 2022/10/3 推出圖像生成服務的網站 NovelAI, 10/6模型就外洩啦!!!
「內耗」一詞源自物理學,和方格子當期主題談的「精神內耗」是兩碼事,加上本沙龍刊載文章似乎界定在書寫自己嘗試 AI 圖像生成的紀錄,完全離題,發這篇文顯然只想湊熱鬧蹭一波點擊率......嗎?
經過努力嘗試,我實在很難把" AI 生成圖像"與"繪圖"產生連結。繪圖哪需要這麼麻煩,但如果不克服畫人的缺陷,如何讓角色推演更多故事? 於是 Waifu Diffusion 現身。
2022 下半年的 AI 圖像生成技術這麼難用,為什麼還能掀起熱潮? 因為 AI 產的怪圖太怪了。
自 NovelAI 官方發推提及自家 AI 模型學習 Danbooru 圖庫後,有網友抓包 AI 餵太多帶有繪師簽名的圖片,連自己生成的圖片都出現簽名了。但這大概不是人工智慧覺醒黎明。
自 NovelAI 模型外洩後,技術人士分析該模型如何在二次元風格表現優異、普通愛好者則將目光鎖定在 Danbooru tag 庫上,是為大 prompt 時代。
因為 SD 慢慢跑也是跑得動,我一向懶得關注線上付費 AI 圖像生成資源,但當時仍有件事讓專注於本機的我注目,也就是 2022/10/3 推出圖像生成服務的網站 NovelAI, 10/6模型就外洩啦!!!
「內耗」一詞源自物理學,和方格子當期主題談的「精神內耗」是兩碼事,加上本沙龍刊載文章似乎界定在書寫自己嘗試 AI 圖像生成的紀錄,完全離題,發這篇文顯然只想湊熱鬧蹭一波點擊率......嗎?
經過努力嘗試,我實在很難把" AI 生成圖像"與"繪圖"產生連結。繪圖哪需要這麼麻煩,但如果不克服畫人的缺陷,如何讓角色推演更多故事? 於是 Waifu Diffusion 現身。
本篇參與的主題活動
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
最近玩到了一個我覺得很新奇有趣的軟體,叫做SillyTavern。 SillyTavern是專用於創建虛擬角色的AI聊天軟體,SillyTavern是TavernAI的分支,但SillyTavern走上了自己的路,加進了許多額外功能,並且仍在積極的持續更新中。 然後,可以色色!
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
最近玩到了一個我覺得很新奇有趣的軟體,叫做SillyTavern。 SillyTavern是專用於創建虛擬角色的AI聊天軟體,SillyTavern是TavernAI的分支,但SillyTavern走上了自己的路,加進了許多額外功能,並且仍在積極的持續更新中。 然後,可以色色!
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
01/22 教練藏寶圖 - 2024 Q1 精彩記錄!! (20%以上的) - 6239 力成 (11/29=>1/2) 25% 6526 達發 (11/7=>1/2) 25% 2230 泰茂 (11/2=>1/5) 25% 8410 森田 (12/8=>1/5) 20% 2530
Thumbnail
老朋友、新朋友,大家新年快樂!本文分享我的「2023年閱讀10問」。新的一年,讓我們繼續追求心中所愛的事物,一同熱情分享!
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
01/22 教練藏寶圖 - 2024 Q1 精彩記錄!! (20%以上的) - 6239 力成 (11/29=>1/2) 25% 6526 達發 (11/7=>1/2) 25% 2230 泰茂 (11/2=>1/5) 25% 8410 森田 (12/8=>1/5) 20% 2530
Thumbnail
老朋友、新朋友,大家新年快樂!本文分享我的「2023年閱讀10問」。新的一年,讓我們繼續追求心中所愛的事物,一同熱情分享!