AI換臉軟體-ReActor(stable diffusion外掛,簡易版Lora):讓你把川普換成拜登

更新於 2024/02/20閱讀時間約 9 分鐘

前言:

1.我能理解大家都愛看帥哥美女,但這種可能涉及肖像權的文章,我還是保守一點使用遠在外國的大牌政客川普與拜登來做為例子,第一是他們是大家都認識的知名人物,第二是他們應該沒那麼無聊會跑到台灣地區的方格子裡面來查探是否有人使用他們的照片甚至跨海提告。退一步說,這兩個人的迷因圖早就全世界都是了,讓我拿來開一點玩笑應該是無所謂的。
因此,做為一篇公開文章,我只能以不敏感的外國人物做為圖片來源,至於各位看官自己想畫美女圖還是帥哥圖還是你家小孩的圖就不關我的事了。
2.我今天要介紹的是把ReActor安裝在stable diffusion webUI的過程與操作,詳細的技術細節可以參考軟體原址:
https://github.com/Gourieff/sd-webui-reactor
3.換臉結果受原圖品質影響甚巨,若圖源的人物長相清晰明確且無任何光影干擾,而圖片背景組成也單純的情況下,換臉結果會較好。但ReActor已經算是足夠智慧化了,即使無法準備太精緻的參考圖源,換臉結果也還算過的去,只是可能長相相似度會低一點。當然人物本身的長相也是影響因素之一,如果人物的長相比較有辨識度比較有特色,那換臉後的效果比較明顯。

簡介:

ReActor算是近期的AI換臉軟體之一,沒錯,它只是眾多類似的軟體中的其中一個,但一些常見且名稱相似的AI換臉軟體其實底層技術都是一樣的東西,只是套上不同的皮而已,實際的換臉效果也是一模一樣的,所以擇一使用即可,而我選擇介紹的便是這款ReActor。

而其它類似的軟體還有FaceChainFaceSwapLabroopFaceFusion等等,用這些關鍵字查詢都可以找到大同小異的東西,但其實沒必要全部安裝,因為底層都是一模一樣的東西。

雖然這款軟體在安裝上也是要懂一點電腦知識,但已經算是簡單易用的換臉軟體了,比起更早期的deepFake(深偽)已是簡單許多,deepFake就是被網紅小玉拿來做名人A片引起宣然大波的那個AI換臉軟體,deepFake我有粗略的試玩過,使用步驟多,要設定的參數也多,並且需要開著電腦執行長時間的AI學習,最後的效果也不太好。

回到ReActor來說,它最單純的作用便是對圖片執行換臉,以下隨手測一個簡單的例子,使用ReActor將拜登的臉換成川普的臉:


拜登原圖

拜登原圖

換成川普臉的拜登

換成川普臉的拜登


從AI繪圖與stable diffusion webUI的角度來看,ReActor可以視為Lora的替代品,它免除了繁雜的Lora訓練過程讓你立刻可以做出特定人物的AI畫像。

ReActor可以視為一種簡易的Lora工具,但它無法直接取代Lora,因為Lora可以仿造的範圍更廣,Lora除了可以模仿人物長相之外,還能學習繪畫風格,色調,形狀等較抽象的圖片特徵,並且能夠跟stable diffusion webUI的本體功能深度結合。相對的,ReActor的強項僅在於「換臉」這件事,它在本質上與Lora有著不同,所以這兩者之間雖有相似之處卻無法互相取代對方。

安裝過程:

0.安裝stable diffusion webUI

既然這軟體是stable diffusion webUI裡面的外掛,那你當然首先是要安裝好一套stable diffusion webUI了,我也假設你已經對stable diffusion webUI有一定的了解了,若你是從零開始的使用者,可以參考我以前寫過的stable diffusion webUI安裝教學:

AI繪圖-四分鐘四個步驟!簡易快速安裝單機版stable-diffusion-webui(AUTOMATIC1111)


1.安裝VS開發者工具

先至下列網址下載VS本體,下載免費版本即可,當然若你本來就已安裝好VS開發者工具可以免除這一步。

raw-image


安裝好VS本體後在程式清單中應該會出現VS選項。接著照以下圖例安裝好VS C++桌面套件:


raw-image
raw-image
raw-image


2.安裝ReActor

接著便是開啟stable diffusion webUI,並切換到Extensions頁籤開始安裝ReActor,它的安裝方法與一般外掛的安裝方式一模一樣。

raw-image

完成安裝後需要重啟stable diffusion webUI,並且可能會需要重啟很多次。

在這個階段你需要注意背景cmd視窗的訊息,看看是否有跳什麼錯誤或是出現--- PLEASE, RESTART the Server! ---這個訊息,如果有跳錯誤或是出現重啟server的提示你就要把stable diffusion webUI及cmd背景視窗完全關閉再重開,這個過程可能要重複很多次,直至完全沒有錯誤或重啟提示為止。

並且初次執行時它還會花一些時間下載必要的模型檔,這個階段沒什麼技術重點卻是讓我試到心累,中間一度try到懷疑人生,懷疑整個軟體都被我弄壞了差點把整個stable diffusion webUI重裝。

3.實際使用

若你成功渡過了安裝階段,那麼恭喜你,現在就可以開始使用了。

以下展示三種常見的應用情境,通常不需要特別修改預設參數,直接使用即可。

1.AI圖片換臉:

假設你已在文生圖介面生好一張圖:

raw-image


接著若想把這張圖套上川普的臉,那就先把圖片seed固定住,以防重繪時圖片跑掉。接著開啟ReActor子頁籤並勾選啟用,同時在ReActor介面上傳一張川普的臉部參考圖:

raw-image


接著在其餘參數不動的情況下,再次執行文生圖的圖片繪製,川普的臉就會被套上原先的那個AI人物了:

raw-image

在這個情境中,類似於使用Lora繪製特定人物的感覺,但ReActor是專精於「換臉」這件事,並且它也只負責「換臉」,所以它更像是把川普的臉皮貼上原本的圖片人物之中。

而如果是使用川普Lora的情況下,就不只是換臉,而是畫出整個川普,當然使用Lora的情況下就會被Lora的訓練品質影響,以下範例我是使用網路上現成的川普Lora繪製,顯然使用Lora也是有著不確定性,在生成的兩張圖中,左圖比右圖更像:

raw-image


Lora可以憑空生出特定人物的圖並加以指定該人物的外貌與穿著細節,而ReActor則必然要先準備好特定人物的長相參考圖以及準備置換的目標圖。

所以說ReActor與Lora兩者有著微妙的不同,應用的場景也有所不同,但ReActor比較好入門是肯定的,因為Lora除了有技術門檻之外,煉製過程也非常耗時,而且最終結果也不一定會符合期待,而我用的這個川普Lora算是品質不錯的那種,所以人物相似度才能這麼高。

回到一開始的那個例子,在相同操作之下,我把參考圖換成拜登的臉,則生成結果也會套上拜登的臉:


raw-image
raw-image


2.真實照片換臉:

第二個應用情境是真實照片的換臉,這種應用場景比較貼近於deepFake,當然你的圖源不一定要是照片,只要是一個現成的圖檔即可,不論是真人照片或是二次元動漫圖皆可,但你的長相參考圖與置換目標圖最好畫風一致,把二次元與三次元的圖片混用的結果肯定很獵奇:

川普換成動畫少女臉

川普換成動畫少女臉


如果想要對現成圖片執行換臉的話,就要切換到圖生圖的介面,並且上傳一張原始圖片,在這裡以拜登的照片為例:

raw-image


接著將重繪權重(Denoising strength)調整至零,這是為了維持原圖檔內容,避免AI隨意亂畫:

raw-image


再往下的操作也是差不多,啟用ReActor並上傳一張川普的臉做為參考圖:

raw-image


接著直接執行繪圖,此時便可把拜登的臉換成川普的臉:

raw-image

3.多人換臉:

上面的例子都是最簡單的一對一換臉,如果是多臉互換的情境下,就不得不調整一些參數了,在這個階段我同樣以文生圖中的AI繪圖換臉為例。

我先產出一張有三張臉的原始圖片並將Seed固定:

raw-image

接著同樣啟用ReActor並上傳一張有兩張臉的參考圖片:

raw-image

這時要關注的是Source Image與Target Image這兩個參數。

Source Image要填入想使用的參考圖臉部號碼,臉部號碼是左邊起算,並且起始號碼是0號,以上述例子來說,左邊的第一張拜登臉就是0號,而第二張川普臉就是1號,依此類推。

因此我在Source Image填入了0,1代表0號臉拜登與1號臉川普我都想用來置換長相。

而Target Image代表要被置換的目標圖片臉部編號,編號方式同上,這裡我填入2,1代表目標圖片的2號臉(=第三張臉)要替換成0號長相(拜登),而目標圖片的1號臉(=第二張臉)要替換成1號長相(川普)。

兩列參數的數組是要排在一起看會比較好懂:

0,1 -->長相參考來源號碼

2,1 -->要被置換的臉部號碼

則置換結果如下:

raw-image

這邊的數組設定可能有點複雜也有點難懂,如果是更多人的長相要交叉互換的情境就會更複雜,我覺得多臉交叉互換的使用情境是比較少見的,如果真的無法理解其實也就算了。

結語:

換臉這東西也不算新奇了,只是仍然一直在推陳出新,例如我前面提到的deepFake已經是遠在chatGPT與AI繪圖出現之前的產物了,而目前也有許多手機APP可以簡單的幫你把自己的長相換到一些電影片段或是明星的跳舞影片之中,這些都是換臉技術的應用。

當然包括ReActor在內的很多工具是被用來做些色色的事,但技術本身是單純的,至於被拿來怎麼用就是人的問題了,不給人家買木炭烤肉並無法真正的防止自殺。

ReActor算是個有趣小玩具,簡略的介紹給大家玩玩。

在這個時間點,換臉已經不是熱門話題,大家可能都在等著看OpenAI的Sora的AI生成影片能夠到達什麼境界,是否又能帶來新的AI革命。








avatar-img
276會員
90內容數
沙龍自介: 雜文派,舉凡AI介紹、科技新知、廢談網誌、小說動漫通通都寫。雖說如此,但目前以AI與科技類文章為主軸,我也不知道怎麼變這樣的,holy 媽祖。 本人不喜歡看長篇文章,也不擅長寫長篇文章,我的意思是:我的優點是廢話很少,看我一篇文不會花你太多時間。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
因人廢言 的其他內容
2024年了,回顧一下我這整年寫過的文章,也回顧一下我用過的那些AI繪圖工具,2023真的是AI爆發的一年,如今AI工具已然滿大街都是,但這個專題我儘量還是本著初心,只介紹自己覺得有用的工具。 本文精選7個即使歷經一年的AI狂潮洗禮後我仍然覺得值得實用的AI繪圖工具。
今天簡單的介紹一下krea.ai這個網站,主打特色是可以讓你在網站上即時手繪並將你的手繪圖即時轉為美化的AI圖片。 我不知道你的圖畫的爛不爛,反正我是畫的很爛,但這網站可以把我的爛圖救回來而且還很好玩。 krea其實已經出來一陣子了,看一些介紹大致可知它是即時幫你把手繪圖轉成較精緻的AI圖
會想做這個只是最近剛好在玩AnimateDiff,然後也剛好我最近才後知後覺的把半年前流行的動畫「我推的孩子」看完。 本文簡單的展示試玩作品以及使用AnimateDiff時遇到的一些狀況與心得。
今天來介紹一個小玩具,可以簡單的以文字生成影片。 AI影片的生成工具已經發展一段時間了,但以往的效果都不太好,所以我一直都沒介紹。而今天介紹的這個Moonvalley總算是可以無中生有的以純文字來產生短影片了,而且效果還算不錯。 先談談舊工具的常見缺點 我個人將AI影片的發展大致分成三個時期,
DALL·E 3是OpenAI近期推出的繪圖模型,相對於舊版可以說是進步的非常非常多。 目前在微軟的bing與chatGPT Plus中都可以試用DALL·E 3,這篇文章除了簡介DALL·E 3的進步與特性之外,也比較在bing與chatGPT Plus這兩個平台中使用DALL·E 3有何不同?有
幾乎可以說是跟stable diffusion一體同命的ControlNet的XL版本總算是上線了,算是為SDXL補上最關鍵一塊地圖,以下快速的來瀏覽一下它的安裝方式與功能吧。
2024年了,回顧一下我這整年寫過的文章,也回顧一下我用過的那些AI繪圖工具,2023真的是AI爆發的一年,如今AI工具已然滿大街都是,但這個專題我儘量還是本著初心,只介紹自己覺得有用的工具。 本文精選7個即使歷經一年的AI狂潮洗禮後我仍然覺得值得實用的AI繪圖工具。
今天簡單的介紹一下krea.ai這個網站,主打特色是可以讓你在網站上即時手繪並將你的手繪圖即時轉為美化的AI圖片。 我不知道你的圖畫的爛不爛,反正我是畫的很爛,但這網站可以把我的爛圖救回來而且還很好玩。 krea其實已經出來一陣子了,看一些介紹大致可知它是即時幫你把手繪圖轉成較精緻的AI圖
會想做這個只是最近剛好在玩AnimateDiff,然後也剛好我最近才後知後覺的把半年前流行的動畫「我推的孩子」看完。 本文簡單的展示試玩作品以及使用AnimateDiff時遇到的一些狀況與心得。
今天來介紹一個小玩具,可以簡單的以文字生成影片。 AI影片的生成工具已經發展一段時間了,但以往的效果都不太好,所以我一直都沒介紹。而今天介紹的這個Moonvalley總算是可以無中生有的以純文字來產生短影片了,而且效果還算不錯。 先談談舊工具的常見缺點 我個人將AI影片的發展大致分成三個時期,
DALL·E 3是OpenAI近期推出的繪圖模型,相對於舊版可以說是進步的非常非常多。 目前在微軟的bing與chatGPT Plus中都可以試用DALL·E 3,這篇文章除了簡介DALL·E 3的進步與特性之外,也比較在bing與chatGPT Plus這兩個平台中使用DALL·E 3有何不同?有
幾乎可以說是跟stable diffusion一體同命的ControlNet的XL版本總算是上線了,算是為SDXL補上最關鍵一塊地圖,以下快速的來瀏覽一下它的安裝方式與功能吧。
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
近期一則有趣的生成式AI新聞,內容是這樣說的:「像是ChatGPT等生成式AI,跟人一樣會產生幻覺。所謂的幻覺,是指生成式AI用錯誤、甚至是不存在的資訊回答使用者的提問。其中的錯誤率,ChatGPT是3%,Meta旗下的聊天機器人是5%,而Google的PaLm竟高達27%。」
Thumbnail
推薦一款可以免費進行AI視頻換臉和圖片換臉的工具,非常好用,名字叫Swapface,它只有windows端,登錄註冊後即可使用,每天有10次免費的換臉次數,我覺得已經完全夠用。不管是直播換臉,還是一段視頻更換上自己的臉,或者是傳統的圖片換臉,這款Swapface都有很好的效果。快去試試看吧!效果霸群
Thumbnail
人工智能幫助生活,回答問題,是一個極為常見的用法,大家最喜歡說的都是它上之天文,下知地理,但是,真的是這樣嗎? 人工智能幻覺(AI 幻覺),是一個AI領域內的名詞,指的是他面對用戶的問題的自信反應。 他會真真假假的回答出完全不正確的內容,並且提出很多支持佐證的說詞。
Thumbnail
消費性產業已經越來越多資金擴散 已經好幾個都創今年新高 代表這就是市場目前共鳴,非常清楚現在的景氣藍燈節奏 今年瞎忙的人長什麼樣子也都很清楚了 不管哪一次多大行情都是長這樣,就是大多數人都在市場靠運氣刷存在感 "景氣藍燈結束就是更多人會的市場節奏了,因為答案都會越來越多,產業訊息也會越
Thumbnail
AI股當沖熱度不減,緯創分盤交易降溫 今天要跟大家分享一下最近台股的熱門話題:AI股。AI股是指與人工智慧相關的產業或公司,包括伺服器、雲端運算、晶片、模組等等。近期因為外資看好台灣的AI供應鏈,以及蘇姿丰將來台訪問的消息,引發了市場對AI股的熱烈追捧,尤其是緯創、光寶科、英業達、廣達、仁
Thumbnail
亞瑪遜購物網站出現ai(小寫代表我的抗議)機器人為產品做推薦和評價 而且誠實的在開頭就寫著:身為一個ai語言模型…… 比如一件舒適T恤 它會說:身為一個ai 語言模型 我雖沒有身體 但我了解舒適衣服的重要性…… 這是什麼鬼 按我的邏輯 這就是睜眼說瞎話 電視機裡的廣告我從來不信 也發表“眼見不一定為
Thumbnail
今天在商周的一篇文章中看到一件有趣的事,讓我非常開心,原來我和文中的數學家在做同樣一件事:用ChatGPT 來召喚靈感!其實不管ChatGPT說的是對的,還是錯的,都有助於我找到靈感。 其實在來到方格子之前,我也在Blogger中寫過一小段時間網誌,甚至更早之前,在中華電信的個人空間中…
Thumbnail
「TED」上同步換臉、出道當換臉歌手,我們的眼睛將越來越不可信。 就在四月份,TED主席「克里斯.安德森」與AI工作者「Tom」在一場TED論壇上對談,這對Chris來說是一個相當詭異的經驗,因為Tom直接在現場將自己的臉跟聲音都換成了Chris。 深偽技術(deepfake)我們應該不會太陌生,不
Thumbnail
「AI 幻變王國」的時空隨時都在幻變,四季輪替日夜轉換,真假難辨一不小心就會墜入宇宙外太空,再也找不到回家的路,融合了東方台日與西方文化之美的建築、服裝之美,城裡的建築與街道極其夢幻,有穿著的日式和服的女孩們在整理與打掃,平常街道一排的松樹,必要時就會變成專車擔任運輸的交通工具...
Thumbnail
嗨我是STELLA ,科技日新月異,好的技術給不同心態的使用者,呈現出的結果也會不一樣 這樣說,網路犯罪一直是一個大課題 你也可能會開始思考法律是不是跟不上時代的變化? 最近AI 換臉的議題因知名YOUTUBER犯罪而浮上檯面,是首例AI換臉技術犯罪 深偽技術的犯罪台灣現在沒有法律約束,如果你不幸是
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
近期一則有趣的生成式AI新聞,內容是這樣說的:「像是ChatGPT等生成式AI,跟人一樣會產生幻覺。所謂的幻覺,是指生成式AI用錯誤、甚至是不存在的資訊回答使用者的提問。其中的錯誤率,ChatGPT是3%,Meta旗下的聊天機器人是5%,而Google的PaLm竟高達27%。」
Thumbnail
推薦一款可以免費進行AI視頻換臉和圖片換臉的工具,非常好用,名字叫Swapface,它只有windows端,登錄註冊後即可使用,每天有10次免費的換臉次數,我覺得已經完全夠用。不管是直播換臉,還是一段視頻更換上自己的臉,或者是傳統的圖片換臉,這款Swapface都有很好的效果。快去試試看吧!效果霸群
Thumbnail
人工智能幫助生活,回答問題,是一個極為常見的用法,大家最喜歡說的都是它上之天文,下知地理,但是,真的是這樣嗎? 人工智能幻覺(AI 幻覺),是一個AI領域內的名詞,指的是他面對用戶的問題的自信反應。 他會真真假假的回答出完全不正確的內容,並且提出很多支持佐證的說詞。
Thumbnail
消費性產業已經越來越多資金擴散 已經好幾個都創今年新高 代表這就是市場目前共鳴,非常清楚現在的景氣藍燈節奏 今年瞎忙的人長什麼樣子也都很清楚了 不管哪一次多大行情都是長這樣,就是大多數人都在市場靠運氣刷存在感 "景氣藍燈結束就是更多人會的市場節奏了,因為答案都會越來越多,產業訊息也會越
Thumbnail
AI股當沖熱度不減,緯創分盤交易降溫 今天要跟大家分享一下最近台股的熱門話題:AI股。AI股是指與人工智慧相關的產業或公司,包括伺服器、雲端運算、晶片、模組等等。近期因為外資看好台灣的AI供應鏈,以及蘇姿丰將來台訪問的消息,引發了市場對AI股的熱烈追捧,尤其是緯創、光寶科、英業達、廣達、仁
Thumbnail
亞瑪遜購物網站出現ai(小寫代表我的抗議)機器人為產品做推薦和評價 而且誠實的在開頭就寫著:身為一個ai語言模型…… 比如一件舒適T恤 它會說:身為一個ai 語言模型 我雖沒有身體 但我了解舒適衣服的重要性…… 這是什麼鬼 按我的邏輯 這就是睜眼說瞎話 電視機裡的廣告我從來不信 也發表“眼見不一定為
Thumbnail
今天在商周的一篇文章中看到一件有趣的事,讓我非常開心,原來我和文中的數學家在做同樣一件事:用ChatGPT 來召喚靈感!其實不管ChatGPT說的是對的,還是錯的,都有助於我找到靈感。 其實在來到方格子之前,我也在Blogger中寫過一小段時間網誌,甚至更早之前,在中華電信的個人空間中…
Thumbnail
「TED」上同步換臉、出道當換臉歌手,我們的眼睛將越來越不可信。 就在四月份,TED主席「克里斯.安德森」與AI工作者「Tom」在一場TED論壇上對談,這對Chris來說是一個相當詭異的經驗,因為Tom直接在現場將自己的臉跟聲音都換成了Chris。 深偽技術(deepfake)我們應該不會太陌生,不
Thumbnail
「AI 幻變王國」的時空隨時都在幻變,四季輪替日夜轉換,真假難辨一不小心就會墜入宇宙外太空,再也找不到回家的路,融合了東方台日與西方文化之美的建築、服裝之美,城裡的建築與街道極其夢幻,有穿著的日式和服的女孩們在整理與打掃,平常街道一排的松樹,必要時就會變成專車擔任運輸的交通工具...
Thumbnail
嗨我是STELLA ,科技日新月異,好的技術給不同心態的使用者,呈現出的結果也會不一樣 這樣說,網路犯罪一直是一個大課題 你也可能會開始思考法律是不是跟不上時代的變化? 最近AI 換臉的議題因知名YOUTUBER犯罪而浮上檯面,是首例AI換臉技術犯罪 深偽技術的犯罪台灣現在沒有法律約束,如果你不幸是