好久沒在方格子冒泡了,最近又跑回來研究 AI 影片,想說一起把這段時間的心得記錄下來。
這陣子真的覺得 AI 影片越來越成熟了。一開始我是在玩 Sora,但在「角色一致性」這塊一直撞牆,怎麼調都不太穩。結果後來發現 Vidu,角色一致性直接把我震撼到,而且操作起來超直覺,不用搞一堆複雜設定。
價格我覺得也算親民,重點是每天登入就有免費次數可以玩,新註冊還會再送額外額度,基本上不用先燒積分就能爽測——真的很佛。VIdu網站> https://www.vidu.com/zh/home/recommend
Vidu Q2模型介紹
如果你去看 Vidu Q2 的官方示範影片(也就是它的「參考生視頻」),很快就會發現它跟之前的 AI 影片工具有點不太一樣。
從多個測試與介紹來看,Vidu Q2 在以下幾個方面有明顯提升:
角色/物件的一致性:
影片中的人物或物件在多個畫格中保持一致,不容易出現扭曲、變形、跳格的情形。
微表情與“演員感”:
影片中的人物臉部、眼神、嘴唇運動,比起早期版本或其他工具更細膩、更有「在演戲」的感覺。
鏡頭語言/攝影感動作:
如推進、拉遠、追蹤鏡頭、也支援 2–8 秒片段(也就是比較短但精緻的影片片段)且較穩定。
操作簡化/多種模式:
像是支援 參考生視頻以外、還有圖生視頻,還包含頭尾幀設定,還有文生視頻等等,以及延長視頻可以最多達5分鐘等
參考生視頻
- 先來簡單看看介紹視頻
- 一開始他會送你免費的2次生成,讓你測試,生成速度也超快,不用等。

- 再來我們需要先放兩張圖上去,最好是
半身或是全身圖效果較好,可以放入你想使用的物品,以及想要的場景,如果沒有物品和場景也沒關系,你只需要用文字描述即可。

這是我生成的ai模特兒,拿來讓你們對照視頻模樣

- 我們在給些提示詞,利用@可以選擇你要的參考圖。

- 最後來看成品,效果挺好。
多人角色一致視頻
- 多人的效果也挺好,我目前設定兩個人,當然最多可以
設定達7人。

- 而這次我想生成搭配音效與人聲,因為Vidu Q2有限制說,需要只能兩張圖,才能搭配人聲,這次我就設定兩個人,想看看效果

- 來看看成品,雖然發音不太標準,但最少有聽到<此茶真香>
複雜的角色精準控制
無論是細節豐富的角色,還是複雜的物體,Vidu都能保證其在多個不同視角下的一致性。
造型複雜的3D動畫風格角色,無論視角如何變化,Vidu始終確保頭型、服飾的全角度細節一致,避免了傳統視訊模型在複雜視角切換時產生的瑕疵。簡單來說最好是有三視圖,你的角色在視頻上,才會更加真實。
後我會陸續推出一些 Vidu Q2 的攻略和各種奇妙測試,這篇文章真的花了我不少腦細胞。如果你覺得有幫上忙,麻煩動動手指頭幫我點個讚,救救一位努力研究 AI 的可憐創作者(我本人)。谢谢各位啦!





