除了 Sora 2、Gemini(Veo 3.1) 這類原本就具備「圖片轉影片」能力的生成式工具之外,現在又多了一個值得關注的新選項。Grok 也正式開放這項功能,而且目前 可以免費使用,對創作者與一般使用者來說相當有吸引力。
過去需要付費或排隊等待的技術,現在已經逐漸走向普及。無論是把單張圖片做成動態短片,用於社群貼文、簡報展示、概念視覺化,甚至是故事分鏡,都能更快速完成原型。


我先使用 Sora(https://sora.chatgpt.com)和 Gemini(https://gemini.google.com) 製作了一些人的圖像。

連線 Grok(https://grok.com),在 Grok 中進入 Imagine 頁面,上傳上面這個圖形檔。Grok 隨即展開轉換成影片的動作。

影片可以下載為MP4。(下圖為轉換 GIF 檔)

你也可以下指令轉換為想要的影片內容,例如,提示詞:讓女主角走台步。

得到的影片效果非常的好!你在 Imagine(https://grok.com/imagine)的頁面,也可以參考他人的好表現。

Grok 的「圖片轉影片」功能(Image-to-Video)主要透過其 Grok Imagine 模型實現,讓用戶能快速將靜態照片轉化為帶有音訊的短片。

核心功能特色
- 自動動畫與音效:上傳圖片後,Grok 會利用其視覺模型自動分析背景與主體,預測合理動作並同步生成背景音樂或音效。
- 短秒數創作:生成影片長度通常在 6 和或 10 秒,適合製作社群短影音或梗圖。
- 多樣風格模式:提供 Fun(有趣)、Normal(正常)等風格選擇。
- 靈活比例:支援 16:9(橫向)、9:16(直向)及 1:1(正方形)等多種長寬比。
操作步驟教學
- 進入 Imagine 介面:在 Grok 網頁版 (grok.com) 或行動裝置 App 中,找到 Imagine 標籤或點擊圖像圖示。
- 上傳圖片:點擊附件連結或圖片圖示,從相簿選取欲轉換的照片。
- 輸入提示詞(選填):
- 自動模式:不輸入任何文字,直接點擊生成,Grok 會自動分析圖片並賦予動畫。
- 自定義模式:輸入具體動作(如:「緩慢運鏡」、「下雨特效」),導引 AI 進行特定轉換。
- 生成與下載:點擊 Generate(生成),稍等數秒即可預覽並下載生成的 720p 影片。
然而,因為 vocus 的網頁編輯器無法上傳影片檔,所以我先利用 Gemini 做了一個 MP4 轉 GIF 的轉換器。再把由 Grok 製作的影片轉換為 GIF 檔,才能讓你看到結果。




















