我用 Google Veo 3.1 做了幾段動漫風短片——使用心得評測

更新 發佈閱讀 5 分鐘

結論先講

Veo 3.1 是偏「實用派」的 AI 影片生成器。它可以同時生成影像與聲音,還提供製作現場很需要的控制工具:參考圖 轉場影片擴充。拿來做短秒數的視覺稿、預覽片或社群短片,很容易把氣氛「做出來」。我用動漫風測試時,線條穩、鏡頭運動自然,環境音也能快速奠定氛圍。這些都是 3.1 的新重點。


3.1 到底多了什麼?為什麼重要

  • 原生音訊:不只畫面,連環境音、音效、簡單台詞都能一起生成,方便「先感受情緒」。
  • 更懂鏡頭語言:像「近景、推鏡、黃昏逆光」這種指令,貼合度更高。
  • 圖片轉影片 更穩:角色/產品的一致性更好,適合品牌或角色連貫表現。
  • 製作向控制:支援最多 3 張參考圖First/Last Frame 平滑過門、影片擴充 把上一段的動作/聲音延續下去,能把 8 秒片段「無縫接長」。

輸出規格(重點版)

  • 時長/解析度:預設 8 秒720p / 1080p
  • 模式文字轉影片圖片轉影片,並可用影格指定與延長。
  • 存取:一般用戶可在 Gemini App/DeeVid AI 生成;開發者可用 Gemini API/AI Studio/Vertex AI
  • 出處標記:Gemini 端的成品帶有可視或嵌入式 SynthID,利於來源辨識。
    以上皆可在官方頁面與文件找到對應說明。

實測:用「動漫風」檢查穩定度

線條與上色

輪廓線的「冒動」很少;即使平移、推鏡,塊面與漸層也不容易破相。這對動漫風格尤其重要。

vocus|新世代的創作平台

運鏡與動態

像「手持」「慢速推近」這類說法,模型能準確跟。人物動作、服飾與頭髮的晃動也較少出現幾何扭曲。

vocus|新世代的創作平台

理解指令

「反差逆光的邊緣光」「前景物件形成視差」「拉焦」等電影語彙能有效影響畫面。 台詞方面,短句可用來測情緒;長段落對口型/自然度仍建議後期 ADR 或 TTS 補強,Google 也把「語音自然度」列為持續優化方向。

vocus|新世代的創作平台

如何強化一致性(製作現場最有感)

  • 3 張參考圖(例如角色設定稿、產品三視圖)鎖住髮型、配色、服裝。
  • First/Last Frame 讓 KV(主視覺)自然「活起來」,避免硬切入動畫。
  • Scene Extension 延續上一段最後 1 秒的動作與聲音,能接出 30–45 秒的預覽序列。

Veo 3.1 vs Sora 2:快速比較

Veo 3.1 的優勢

製作導向的控制(參考圖、影格轉場、延長)完善,且一般用戶與開發者都能直接用:Gemini App、API/AI Studio/Vertex/Flow 都已經到位,對要立刻接入工作流程的團隊很友善。

Sora 2 的優勢

更激進地追求物理/世界一致性,以及新的創作 App 體驗。官方公告指出 Sora 2 與獨立 App 正在推進,且有 API 計畫。

怎麼選?

如果你需要「現在就能上線」的穩定接口與製作控制,Veo 3.1 勝在可用性。

如果你想追最前沿的物理真實感與社群創作流程,持續關注 Sora 2 的開放進度。



實作小撇步(寫給導演/PM/剪接師)

  1. 像攝影指導那樣寫提示:用「CU 近景/手持推近/黃昏逆光邊緣光」這種電影語彙下指令,Veo 3.1 會更貼。
  2. 鎖定畫面風格:把角色表、產品照當 3 張參考圖,維持髮型/服裝/色票一致。
  3. 用影格做轉場:靜態 KV → 動態畫面,指定 First/Last Frame 會更順。
  4. 延長要有「銜接點」:上一段最後 1 秒要包含欲延續的動作或語音,Scene Extension 才能無縫接。
  5. 注意出處標記:Gemini 端輸出帶 SynthID(可視/嵌入)有助大規模發布時的溯源管理。

哪裡可以用?

  • 一般創作者:在 Gemini App 直接生成 Veo 3.1 的 8 秒影片,流程簡單、適合做靈感草稿或社群片。
  • 開發者/團隊:用 Gemini API/AI Studio/Vertex AI,可設定參考圖、First/Last、延長、解析度等參數,接進既有工具鏈。

Veo 3.1 on DeeVid AI

DeeVid AI Veo 3.1,直接做排片、上字幕、升頻、配樂。從提案到交付,來回折返更少、迭代速度更快。


總結(我的感受)

  • 日常工作適配度:高。因為「影像+聲音」一次到位,還能以影格/參考圖/延長這些方式做出穩定連續的短片。
  • 動漫風的拿捏:不錯。線條穩定、鏡頭誠實,能更頻繁拿來當「可直接上線」的素材。
  • 注意事項:長段台詞與口型同步還在演進,正式版本建議後期補強音訊。
留言
avatar-img
LIM WETYOENG 的沙龍
3會員
8內容數
LIM WETYOENG 的沙龍的其他內容
2025/09/16
前言|2025 的 AI 生圖,真正的差別在「可控」 今年的關鍵不只是能不能把圖生出來,而是能不能穩定控制:同一角色與風格能否跨張一致、能否用自然語言做局部精修、版面上的文字是否可讀,還要能無縫接上你的設計或行銷工作流。下面這份清單收錄 Nano Banana(Gemini 2.5 Flash I
Thumbnail
2025/09/16
前言|2025 的 AI 生圖,真正的差別在「可控」 今年的關鍵不只是能不能把圖生出來,而是能不能穩定控制:同一角色與風格能否跨張一致、能否用自然語言做局部精修、版面上的文字是否可讀,還要能無縫接上你的設計或行銷工作流。下面這份清單收錄 Nano Banana(Gemini 2.5 Flash I
Thumbnail
2025/09/04
Google 發表了全新的影像生成/編輯模型「Nano Banana」(正式名稱為 Gemini 2.5 Flash Image)。不同於過去強調「從零創建」的 AI 模型,Nano Banana 將重心放在「如何自然地編輯現有照片」。這篇文章將介紹這項新技術的重點功能,以及實際操作的心得。
Thumbnail
2025/09/04
Google 發表了全新的影像生成/編輯模型「Nano Banana」(正式名稱為 Gemini 2.5 Flash Image)。不同於過去強調「從零創建」的 AI 模型,Nano Banana 將重心放在「如何自然地編輯現有照片」。這篇文章將介紹這項新技術的重點功能,以及實際操作的心得。
Thumbnail
2025/06/27
最近在社群媒體上看到一則消息:「Google 最新的 AI 影片生成模型 Veo 3,現在可以在 Deevid 上使用了!」 對 AI 影音創作充滿興趣的我,立刻跑去 Deevid 試用了一下。 結論是:這真的是劃時代的技術,完全打破我對 AI 生成影片的既有印象。
Thumbnail
2025/06/27
最近在社群媒體上看到一則消息:「Google 最新的 AI 影片生成模型 Veo 3,現在可以在 Deevid 上使用了!」 對 AI 影音創作充滿興趣的我,立刻跑去 Deevid 試用了一下。 結論是:這真的是劃時代的技術,完全打破我對 AI 生成影片的既有印象。
Thumbnail
看更多