全AI生成MV|完整計畫到內心崩潰的創作心得

閱讀時間約 1 分鐘



這幾天在忙著交個AI影片競賽的作品,過程中預想的方式不斷打掉調整,最後變成了這樣的成品。


先說結論,所有工具覺得目前推最好用的是 ElevenLabs 的音效生成,可以大量省去找音效的時間!


另外Suno這類的生成音樂服務應該也有機會解決找配樂的問題,如果自己有音樂相關知識應該是可以用BPM的方式去設定出自己要的節奏。如果你已經有一個主調,或許可以用Suno的新功能,自己上傳旋律再生成的功能,來做出有系列感的配樂。


如果你喜歡,歡迎進到下面這個網址幫我按個表情符號,觀眾投票有另外的獎項:https://civitai.com/posts/4479050

其他詳細內容就下面慢慢跟大家分享

文字生音樂:Suno

文生圖:Midjourney

圖生影片:Luma

文生影片:Runway Gen-3

文字生音效:ElevenLabs

剪輯:Premiere

字幕:After Effect

提示詞生成:ChatGPT GPTs

MidJourney V6 Prompt Creator

Runway Gen3 Prompt Enhancer by creamAI

故事參考:Claude




1. AI生成影片製作前認知

2. 原本想做的

3. 後來怎麼做

4. AI生成影片製作認知修正


▌1. AI生成影片製作思路預想

因為了解AI生成影像的原理就是「雜訊」,透過提示詞或是提供的圖像or影片作為藍本,進而形成新的影像。


在沒有藍本的情況下,基本上AI生成就是在「轉扭蛋」,構圖、人物可能完全不是你想要的,所以想要盡可能地提供藍本給AI。也因為本質是扭蛋,所以如果製作方向是重視人物連貫、風格連貫的「劇情片」將會非常痛苦。


因此最優的創作標的應該是可以接受相對不需要劇情,而風格可以接受跳動的MV類。


▌2. 原本想做的

其實這部MV原本想要呈現的方式是像張惠妹《身後》MV的一鏡到底。

PS : 跟後來成品看到的一點關聯都沒有XD


a. UE+SD a. 歐盟+SD

我計畫用Unreal Engine建立場景、人物模型跟攝影機,錄製影片來作為AI生成的藍圖,後續想使用的AI工具是Stable Diffusion Animatediff 搭配 ComfyUI。


不選擇 WebUI是因為 ComfyUI可控性更高、對本機消耗更低,但相對學習曲線也更高。


花了一天半時間學Unreal Engine、花了一天時間學ComfyUI,然後花了半天崩潰Stable Diffusion壞掉,後來因為交片時間不足放棄了這個方案。


b. UE + Style Transfer

用UE建構場景搞定了,但SD的學習曲線過陡,選擇嘗試了競賽合作單位 LensGo跟 DomoAI 的 Style Transfer 功能。


實際使用發現,過於光滑的平面,沒有足夠的雜訊讓AI去產生新的東西,成品過於平淡。

產出影片


c. 穩定器實拍+ AE + Style Transfer


使用實拍的場景再搭配 Style Transfer的成本效果其實不錯。只是要再增加故事性的話,會需要再有人物的加入。


想到的方法是在AE的2.5D空間中,用一個null object綁定實拍影片跟攝影機,然後再在空間中部屬2D人物、物件,讓它們從影片跟攝影機之間經過。


←[影片] 固定(人物) ←[攝影機]


這樣的話,因為最後產出的畫面會是攝影機看到的畫面,所以就可以把人物加入到影片中,進而保留透視感。可以想像成你在看電影的時候,你的視角是攝影機,有人從你前面經過,然後你才看到大螢幕的感覺。


幾個cut還可以,但AE的2.5D環境要建構一整部片,其實不太友善。也可以用這個方法進到Blender或UE這樣的3D環境做,但也因為時間的關係,所以作罷。

產出影片


▌3. 後來怎麼做

Runway Gen-3 + GPTs + GPT

Midjourney + Luma + GPTsMidjourney + Luma + GPT

raw-image

因為交片時間倒數2天,只好回去老方法。魔法小卡拿出來,使用最新的Runway Gen-3。Runway Gen-3 效果其實挺好的,而且官方也有提供指南,教你怎麼做比較好,再搭配相關的GPTs來人腦修正,生成的速度也很滿意。


缺點就是只有720p,然後就算固定seed了,人物、風格還是會亂跑,就算有使用官方提供的提示詞,AI也不一定會聽你的話。優點是生成速度比其他的線上服務非常快,應該每個影片2分鐘內就可以完成。


Luma 從圖生成影片的方式也算滿意,不聽話是預期之內了,但相對可控性比 Runway高一些,因為有原本的圖像作為基礎。缺點是生成速度,特別是晚上的時候特慢,很多都卡一個晚上才好,白天的話倒是有些幾分鐘內就完成。但不確定買付費會員的話會如何。


儘管這兩個工具是相對好用的,但我還是陷入了最前面提到的,想要追求敘事連貫性的苦痛之中,每次按下生成,焦慮感也會一起生出來。


在剪輯的過程中,使用了大量的變速跟倒轉,原本生成的素材運鏡節奏並不是自己想要的,可以透過這樣的方式解決。至於變速後缺幀的問題,原本有想用 DaVinci Resolve解決,但因為原本素材解析度就偏低,後來輸出後耗損嚴重,就沒有做修補。


我原本也有想要在AE裡面做一些煙霧、雨、電視光之類的效果去增加畫面質感,但因為AI影片的影像,並不像實際拍攝的影像穩定,所以追蹤功能並沒有辦法好好的追蹤。


例如現實中的電視機螢幕,怎麼變都是平行四邊形,但AI影片裡的電視就不一定了,周圍的物件變化也都不符合物理世界規則,所以追蹤出來的座標也會有問題。


然後我還有用GPT幫我修一下AE的表達式,來做出歌詞隨著節奏Glow的效果,這方面還挺不錯的。


▌4. AI生成影片製作認知修正

儘管原本就有「扭蛋」跟「不能追求敘事性」的認知,但實際在執行的時候,還是會希望他能多乖乖照自己的分鏡一點。


目前在線上看到成品很棒的AI影片,大多是生成出想要的東西後,再在後期用AE做修飾(畫面穩定的鏡頭中),甚至會再用AE加入手持鏡頭的晃動感。


或是在 Midjourney 生成後,再以PS生成功能,加入相要的元素後再用Luma作微幅的鏡頭運動,確保內容物不會因為大幅運動而大幅變形。


不只在構圖的部分就盡可能的去控制,在影片生成的部分也要盡可能的去躲避AI的弱點。


身為觀眾我們看到的基本上都是創作者大量轉扭蛋後比較好的部分,如果要自己創作的話,建議把乖乖聽話的預期降低到30%成功率,這樣可能心情會比較舒坦。我原本大概只有降到60%,所以在每次修正提示詞後看到成品還是充滿挫折。


希望這段經驗分享對大家有幫助囉

5會員
18內容數
喜歡商業知識的影音創作者 曾是《大人的Small Talk》Podcast製作人 🎧 Podcast製作 🎬影片製作 💡行銷規劃 🤖AI工具分享 [email protected]
留言0
查看全部
發表第一個留言支持創作者!
Billy的沙龍 的其他內容
什麼是「轉換阻力」?給導演E降低阻力的答案是,兒童玩具(咦?!
在《副業教練 EP1|藝術家Y想經營自媒體,該怎麼開始?》這篇,談到了經營自媒體一開始要決定的兩件事「選主題」跟「選戰場」。那「選戰場」,又該怎麼選呢?
教你3種方式跟ChatGPT練習英文口說 ➊ 付費版 探索GPT ➋ 付費版 ➌ 免費版
心理師S平常喜歡逛市集,特別喜歡一個蠟燭品牌,是個生活在台北的外國人自己手工製作的香芬蠟燭,幾乎每隔幾個禮拜就會去補貨。
前陣子一位做電影行銷的朋友J,突然去德國住一個月,考了一張花藝師證照回來,我跟身邊的朋友們一樣都是又驚又喜! 後來有機會碰面聊聊,原來是因緣際會接觸到花藝,後來希望在專案型的電影行銷工作之外,能透過另外一種方式來增加收入,並打造自己的品牌。 朋友J在電影行銷主要走的是實體宣傳的部分,對網路社群行
最近《我的英雄學院》新的一季開播了,簡單來說是職業英雄打擊反派的故事,裡面會將對手稱為「ヴィラン」(villain),而《排球少年》這樣的運動作品裡,則會將對手稱為「ライバル」(rival)。 起初聽到這兩個詞的時候還蠻困惑的,因為有時候字幕都會翻成「敵人」或是「對手」,就開始思考這兩個詞的差別
什麼是「轉換阻力」?給導演E降低阻力的答案是,兒童玩具(咦?!
在《副業教練 EP1|藝術家Y想經營自媒體,該怎麼開始?》這篇,談到了經營自媒體一開始要決定的兩件事「選主題」跟「選戰場」。那「選戰場」,又該怎麼選呢?
教你3種方式跟ChatGPT練習英文口說 ➊ 付費版 探索GPT ➋ 付費版 ➌ 免費版
心理師S平常喜歡逛市集,特別喜歡一個蠟燭品牌,是個生活在台北的外國人自己手工製作的香芬蠟燭,幾乎每隔幾個禮拜就會去補貨。
前陣子一位做電影行銷的朋友J,突然去德國住一個月,考了一張花藝師證照回來,我跟身邊的朋友們一樣都是又驚又喜! 後來有機會碰面聊聊,原來是因緣際會接觸到花藝,後來希望在專案型的電影行銷工作之外,能透過另外一種方式來增加收入,並打造自己的品牌。 朋友J在電影行銷主要走的是實體宣傳的部分,對網路社群行
最近《我的英雄學院》新的一季開播了,簡單來說是職業英雄打擊反派的故事,裡面會將對手稱為「ヴィラン」(villain),而《排球少年》這樣的運動作品裡,則會將對手稱為「ライバル」(rival)。 起初聽到這兩個詞的時候還蠻困惑的,因為有時候字幕都會翻成「敵人」或是「對手」,就開始思考這兩個詞的差別
本篇參與的主題策展
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
最近玩到了一個我覺得很新奇有趣的軟體,叫做SillyTavern。 SillyTavern是專用於創建虛擬角色的AI聊天軟體,SillyTavern是TavernAI的分支,但SillyTavern走上了自己的路,加進了許多額外功能,並且仍在積極的持續更新中。 然後,可以色色!
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
最近玩到了一個我覺得很新奇有趣的軟體,叫做SillyTavern。 SillyTavern是專用於創建虛擬角色的AI聊天軟體,SillyTavern是TavernAI的分支,但SillyTavern走上了自己的路,加進了許多額外功能,並且仍在積極的持續更新中。 然後,可以色色!
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
你可能也想看
Thumbnail
八十-二十法則提到,在多數生活的現象中,約80%的效果是來自於20%的原因,除了經濟學、學習理論外,這個法則同樣也可以應用在生活中的幸福感上。 我們需要認知到擁有的越多不一定會越快樂,反而有可能會因為無法專注在少數事物上而產生空虛、迷茫的感覺。「極簡」精神最重要的一點在於放下對於「多」的執著,將有
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
StockCake 是一個由 AI 人工智慧技術生成免費的圖庫網站,提供大量高品質多類型的圖片,效果逼真,對無論你是要用在專案、網站還是製作簡報,不用註冊或登入即可下載並取得圖片,可用於個人和商業用途,且無需標示出處或作者。
Thumbnail
隨著AI板塊的爆發,各大科技巨頭之間的競爭愈發激烈。尤其是Google與微軟這兩個搜尋引擎的老對手,都想借AI的東風,升級各自的科技服務。微軟背後有OpenAI的ChatGPT技術加持,始終壓Google一頭。
Thumbnail
本文探討了 2023 年創作者與生成式 AI 間的爭訟。內容包括兩個具體案例介紹:插畫家 Sarah Anderson 案和喜劇演員 Sarah Silverman 案,以及法院針對原告主張目前的認定。最後,提出原告目前主張的困境、以及可能的機會。
Thumbnail
Getty Images推出AI圖像生成工具,與Nvidia合作保障版權 圖片供應商Getty Images日前宣布,將與晶片大廠Nvidia合作,推出名為「Generative AI by Getty Images」的AI圖像生成工具。該工具運用了Getty Images豐富的授權圖片資料庫
Thumbnail
中國自2013年以來在幾乎每個合理的地區都建造了隱蔽機場,這是一種明確的軍事布局。然而,台灣附近卻沒有這樣的設施。馬博泰認為:這可能表明中國對台灣的入侵可能不會立即發生。然而,這並不意味著台灣就完全安全,因為美國在台灣附近的飛機卻容易受到導彈襲....
Thumbnail
蒐集資料訓練AI模型與生成式AI模型生成式內容之智慧財產權歸屬 經授智字第11252800520號令函 令函日期:112-06-16 令函案號:經授智字第11252800520號令函要旨: 主旨:有關台端詢問AI與智慧財產權疑問,復如說明,請查照。 說明: 一、復台端112年6月
Thumbnail
做為一個文字與影片內容創作者,做的很多主題都跟AI有關,我不是沒有想過完全交給AI全自動生成這件事,我不只想過還去試了,且真的找出一些方法來,為什麼我沒有選擇這麼做呢?
原始影片:https://youtu.be/-QBU7m0sD9w 在《順流致富》一書中,作者通過測驗將人分為不同類型,如發電機型、技師型、創作者型、交易者型、累積者型、商人型和知識者型等。書中的概念是,根據你的天生個性,你應該尋找與你互補的人合作,使合作更加順利。然而,這種分類方式可能過於簡單和狹
把原影片(https://youtu.be/6e6M_4hhkcE) 字幕餵給AI去整理成文章 這次的主題是成長型心態。這實際上是我們上次談論灰階思考的延續。我們提到,關於灰階思考最重要的事情之一就是:「一切都不是簡單的二分法」。而是存在一個灰色的過度區。今天,我們將以成長心態為例來探討這個觀點。
Thumbnail
聽說美國法律已經明定AI繪圖的作品不能宣告版權。所以大概等同不適合商用。 覺得AI繪圖mj生成的圖片,像是把他人的畫作或照片做質地(各種參數)調整、重新組合(拼貼)……。風格和人、物、景跟以前看過的圖片、照片很像,明顯侵權。 簡單一個少女漫畫的提詞,就可產生很漂亮又 “很眼熟” 的畫作。如果是用別人
Thumbnail
八十-二十法則提到,在多數生活的現象中,約80%的效果是來自於20%的原因,除了經濟學、學習理論外,這個法則同樣也可以應用在生活中的幸福感上。 我們需要認知到擁有的越多不一定會越快樂,反而有可能會因為無法專注在少數事物上而產生空虛、迷茫的感覺。「極簡」精神最重要的一點在於放下對於「多」的執著,將有
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
StockCake 是一個由 AI 人工智慧技術生成免費的圖庫網站,提供大量高品質多類型的圖片,效果逼真,對無論你是要用在專案、網站還是製作簡報,不用註冊或登入即可下載並取得圖片,可用於個人和商業用途,且無需標示出處或作者。
Thumbnail
隨著AI板塊的爆發,各大科技巨頭之間的競爭愈發激烈。尤其是Google與微軟這兩個搜尋引擎的老對手,都想借AI的東風,升級各自的科技服務。微軟背後有OpenAI的ChatGPT技術加持,始終壓Google一頭。
Thumbnail
本文探討了 2023 年創作者與生成式 AI 間的爭訟。內容包括兩個具體案例介紹:插畫家 Sarah Anderson 案和喜劇演員 Sarah Silverman 案,以及法院針對原告主張目前的認定。最後,提出原告目前主張的困境、以及可能的機會。
Thumbnail
Getty Images推出AI圖像生成工具,與Nvidia合作保障版權 圖片供應商Getty Images日前宣布,將與晶片大廠Nvidia合作,推出名為「Generative AI by Getty Images」的AI圖像生成工具。該工具運用了Getty Images豐富的授權圖片資料庫
Thumbnail
中國自2013年以來在幾乎每個合理的地區都建造了隱蔽機場,這是一種明確的軍事布局。然而,台灣附近卻沒有這樣的設施。馬博泰認為:這可能表明中國對台灣的入侵可能不會立即發生。然而,這並不意味著台灣就完全安全,因為美國在台灣附近的飛機卻容易受到導彈襲....
Thumbnail
蒐集資料訓練AI模型與生成式AI模型生成式內容之智慧財產權歸屬 經授智字第11252800520號令函 令函日期:112-06-16 令函案號:經授智字第11252800520號令函要旨: 主旨:有關台端詢問AI與智慧財產權疑問,復如說明,請查照。 說明: 一、復台端112年6月
Thumbnail
做為一個文字與影片內容創作者,做的很多主題都跟AI有關,我不是沒有想過完全交給AI全自動生成這件事,我不只想過還去試了,且真的找出一些方法來,為什麼我沒有選擇這麼做呢?
原始影片:https://youtu.be/-QBU7m0sD9w 在《順流致富》一書中,作者通過測驗將人分為不同類型,如發電機型、技師型、創作者型、交易者型、累積者型、商人型和知識者型等。書中的概念是,根據你的天生個性,你應該尋找與你互補的人合作,使合作更加順利。然而,這種分類方式可能過於簡單和狹
把原影片(https://youtu.be/6e6M_4hhkcE) 字幕餵給AI去整理成文章 這次的主題是成長型心態。這實際上是我們上次談論灰階思考的延續。我們提到,關於灰階思考最重要的事情之一就是:「一切都不是簡單的二分法」。而是存在一個灰色的過度區。今天,我們將以成長心態為例來探討這個觀點。
Thumbnail
聽說美國法律已經明定AI繪圖的作品不能宣告版權。所以大概等同不適合商用。 覺得AI繪圖mj生成的圖片,像是把他人的畫作或照片做質地(各種參數)調整、重新組合(拼貼)……。風格和人、物、景跟以前看過的圖片、照片很像,明顯侵權。 簡單一個少女漫畫的提詞,就可產生很漂亮又 “很眼熟” 的畫作。如果是用別人