辨別偽人,各顯神通【2022/10/6~10/8】

閱讀時間約 4 分鐘

至目前為止,共寫了 3 篇文章回憶 SD 初次使用感受,提及安裝、文生圖、圖生圖。

這些文章都有個共同點 : 對於如何用 AI 生成人物圖像並未多著墨


因為那段時間大量使用文生圖試錯,各種歪七扭八的偽人圖片已經品鑑得夠多了,再試下去簡直是在玩偽人版的請出示證件。比起追求美麗樣貌再屢次為生成結果驚愕,不如直接輸入破滅、無序、渾沌的敘述反而得到人物與環境連結性較為自然的圖像。

結論是想讓 AI 生成人物在 512x768 尺寸限制內比較正常,得控制在 cowboy shot 到 upper body 之間的距離,若全身圖或小腿以下出框,AI 會產出臉部模糊、眼睛細節不對的面孔。某些提示詞譬如亞洲人,甚至會出現歐美普遍對黃種人的刻板印象──細細長長的瞇瞇眼。


顯然是模型問題,但我不得不思考獨顯 4GB 的筆電,是否也是影響 AI 生成品質的因素?

可是筆電才買來一個多月,為這種非本職的生活趣味採購新設備,有必要嗎?


幸好 10/5 圖生圖火車的嘗試,讓我有了新靈感 : 

搭配文生圖與圖生圖兩種功能來生成人物,窮人有窮人的玩法 !


簡單來說,當前筆電如果產出長寬大於 768px 的圖像有概率 out of memory

在此限制下,文生圖可能出現眼歪嘴斜、圖生圖 CFG 低則接近(受限)原圖結構、高則貼近敘述(跳脫原圖),全圖不夠大導致遮罩修復有時會因為空間太小 AI 不好發揮。

那如果先輸入所需 prompt 大量文生圖,再篩選其中少數人體結構正常的圖像去圖生圖,就能得到肢體(較)正常、五官(較)清晰的圖片 !


raw-image
raw-image
為什麼都是軍裝與廢墟背景?這樣AI再怎麼胡亂生成,只會凸顯戰況之激烈啊~

為什麼都是軍裝與廢墟背景?這樣AI再怎麼胡亂生成,只會凸顯戰況之激烈啊~


經過這套流程,有機會突破 Stable Diffusion 模型產出二次元風格人物表情模糊的缺陷,達到近似 2.5D 人物風格效果。但圖生圖不是 Controlnet canny 或 openpose,就算找到完美構圖,給 AI 跑一下發現怎麼前景變背景、人物變建築,因為 AI 不是用事物名稱去分類事物,而是掌握整張圖的特定規律再來加雜訊除雜訊。

raw-image

觀察以電影《愛國者行動》維基頁面海報為底圖,圖生圖產出的成品,可發現原本海報標題、馬克華伯格背影都被 AI 當成建築物。所以這個階段 AI 生成就是乍看氣氛到了,但怎麼引導它做出正確的形象、需求的構圖,明顯不夠直觀。好處在於同樣花時間,用在按鈕抽卡等結果總比開圖層勾線著色不費工夫,只要用戶謹記同一件衣料 AI 看起來像棋盤稿紙綠豆糕,你聽你的鳥鳴、AI 看 AI 的日出,彼此都會有等量的美的感受。


不要執着於外相、虛相而偏離了 AI 生成隨機性本質,偽人不也展現出強韌生命力的美~?


如此鑽研幾天後,2022/10/8,我看見 Waifu Diffusion v1.3 釋出的公告。

使用了 680,000 張高解析度 Danbooru 影像訓練 10 個 Epoch,專門用來生成高品質二次元動漫角色圖像。


果然專業人士有專業人士的玩法啊 !


1會員
15內容數
記錄我在 2022 年 9 月之後使用 AI 生成圖像的嘗試。 這個主題總有一天會沒東西好寫,那就走一步算一步吧...…
留言0
查看全部
發表第一個留言支持創作者!
Bsh的沙龍 的其他內容
即使文生圖功能不完美,Stable Diffusion還有圖生圖功能尚可一戰(?)
安裝 SD 後一週,總算調整成一張 512x768 的圖跑一分鐘同時做自己的事不卡頓,能跑的功能依然有限。但這只是挑戰開端......
整個月嘗試了 SD 模型各種線上產圖服務,但線上工具能做的調整不多,必須生成較多圖片、逐步趨近心中想法。時間就是金錢,所以訂閱線上工具就是雙倍砸錢。
已不記得 Stable Diffusion 於 2022/8/22 發布後,我何時看到相關報導,但我確實從那年 9 月開始留意 AI 生成圖像的網路資訊。 先從 WOMBO Dream 開始......
舊筆電出問題了。日益頻繁意外關機,連轉移資料都得碰運氣。我尋思該救的都救差不多,剩下東西在老是自動關機的環境下也搬不了多少,便大刀闊斧重灌,堪用總比沒得用好。
兩年前的今天,我驚奇發現新買的筆電,恰好達到剛發布沒多久的 Stable diffusion 運轉底線, 從此開啟往後一張 512x768 要等一分鐘,聚沙成塔的日子。
即使文生圖功能不完美,Stable Diffusion還有圖生圖功能尚可一戰(?)
安裝 SD 後一週,總算調整成一張 512x768 的圖跑一分鐘同時做自己的事不卡頓,能跑的功能依然有限。但這只是挑戰開端......
整個月嘗試了 SD 模型各種線上產圖服務,但線上工具能做的調整不多,必須生成較多圖片、逐步趨近心中想法。時間就是金錢,所以訂閱線上工具就是雙倍砸錢。
已不記得 Stable Diffusion 於 2022/8/22 發布後,我何時看到相關報導,但我確實從那年 9 月開始留意 AI 生成圖像的網路資訊。 先從 WOMBO Dream 開始......
舊筆電出問題了。日益頻繁意外關機,連轉移資料都得碰運氣。我尋思該救的都救差不多,剩下東西在老是自動關機的環境下也搬不了多少,便大刀闊斧重灌,堪用總比沒得用好。
兩年前的今天,我驚奇發現新買的筆電,恰好達到剛發布沒多久的 Stable diffusion 運轉底線, 從此開啟往後一張 512x768 要等一分鐘,聚沙成塔的日子。
本篇參與的主題策展
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
最近玩到了一個我覺得很新奇有趣的軟體,叫做SillyTavern。 SillyTavern是專用於創建虛擬角色的AI聊天軟體,SillyTavern是TavernAI的分支,但SillyTavern走上了自己的路,加進了許多額外功能,並且仍在積極的持續更新中。 然後,可以色色!
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
最近玩到了一個我覺得很新奇有趣的軟體,叫做SillyTavern。 SillyTavern是專用於創建虛擬角色的AI聊天軟體,SillyTavern是TavernAI的分支,但SillyTavern走上了自己的路,加進了許多額外功能,並且仍在積極的持續更新中。 然後,可以色色!
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
研究AI生成美女圖像 研究AI生成美女圖像是一個很有趣的方向,特別是對於喜歡速寫但很少畫美女的我來說。AI生成圖像的技術不僅可以幫助創作出我心中所想的形象,還可以作為靈感的來源,讓我在速寫中嘗試新的風格和主題。 基於大量的數據訓練 AI生成的圖像通常基於大量的數據訓練,可以創造出各種不同風格和
Thumbnail
AI生成圖片是一個挑戰性的任務,雖然AI能理解文字需求,但仍無法完全想像心中的理想畫面。使用中文描述AI的生成效果約為5成到6成,而加入擬人化的描述可以讓AI更好地理解需求。無論如何,AI生成圖片仍面臨許多挑戰,需要更多的研究與嘗試。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
  之前擔任了某個分析AI文創挑的評審,活動順利完結,看到了許多人分析該文章是否為AI文、AI文的不合理之處的看法與理由,今天就來以幾個較常看到的、關於AI文的爭議作為出發點,聊聊我個人對於AI文的一點淺見。   由於AI生成的產物種類眾多,因此這裡的「AI文」,只討論故事、小說這類產物。
了解到現在的生成式AI各有千秋,且能協助的事之多,各家業者有如「電信公司」,遲早會是比較「行動方案」,甚或是拿著不同業者的「多門號」,人人都配有人工智慧了。 我一向不是科技的早期使用者,各家AI我都只用過免費版。 ChatGPT 作為前鋒的GPT,曾請它協助將英文句子潤色、修整文法,以解
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
最近AI圖和文章盛行,並沒有說這樣不好,現在也有AI圖和AI文比賽,聽人說有個攝影師用他拍的照片去參加AI圖比賽,結果被發現後退賽,我感到悲哀的是用AI去生成的作品還說是自己寫或畫的,尤其是免費的,設定收費的可能是想賺錢,那免費的又說是自己寫和畫是為什麼呢?滿足自己虛榮心嗎? 最近網路上也看到
Thumbnail
生成式AI工具即將邁入三年,除了ChatGPT以外,也進化了許多GenAI工具,如Sora影片生成等。 你知道Stable Diffusion嗎? 從詠唱魔法師Prompts的玩家或職務,AI浪潮持續推進下,SD-WebUI並沒有停滯或被淘汰。 結果告訴了我們一件事情...
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
研究AI生成美女圖像 研究AI生成美女圖像是一個很有趣的方向,特別是對於喜歡速寫但很少畫美女的我來說。AI生成圖像的技術不僅可以幫助創作出我心中所想的形象,還可以作為靈感的來源,讓我在速寫中嘗試新的風格和主題。 基於大量的數據訓練 AI生成的圖像通常基於大量的數據訓練,可以創造出各種不同風格和
Thumbnail
AI生成圖片是一個挑戰性的任務,雖然AI能理解文字需求,但仍無法完全想像心中的理想畫面。使用中文描述AI的生成效果約為5成到6成,而加入擬人化的描述可以讓AI更好地理解需求。無論如何,AI生成圖片仍面臨許多挑戰,需要更多的研究與嘗試。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
  之前擔任了某個分析AI文創挑的評審,活動順利完結,看到了許多人分析該文章是否為AI文、AI文的不合理之處的看法與理由,今天就來以幾個較常看到的、關於AI文的爭議作為出發點,聊聊我個人對於AI文的一點淺見。   由於AI生成的產物種類眾多,因此這裡的「AI文」,只討論故事、小說這類產物。
了解到現在的生成式AI各有千秋,且能協助的事之多,各家業者有如「電信公司」,遲早會是比較「行動方案」,甚或是拿著不同業者的「多門號」,人人都配有人工智慧了。 我一向不是科技的早期使用者,各家AI我都只用過免費版。 ChatGPT 作為前鋒的GPT,曾請它協助將英文句子潤色、修整文法,以解
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
最近AI圖和文章盛行,並沒有說這樣不好,現在也有AI圖和AI文比賽,聽人說有個攝影師用他拍的照片去參加AI圖比賽,結果被發現後退賽,我感到悲哀的是用AI去生成的作品還說是自己寫或畫的,尤其是免費的,設定收費的可能是想賺錢,那免費的又說是自己寫和畫是為什麼呢?滿足自己虛榮心嗎? 最近網路上也看到
Thumbnail
生成式AI工具即將邁入三年,除了ChatGPT以外,也進化了許多GenAI工具,如Sora影片生成等。 你知道Stable Diffusion嗎? 從詠唱魔法師Prompts的玩家或職務,AI浪潮持續推進下,SD-WebUI並沒有停滯或被淘汰。 結果告訴了我們一件事情...
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。