方格子 vocus

OpenAI Sora：文生成影音的新時代

2025/05/11 更新2024/02/16 發佈閱讀 6 分鐘

2023年4月，紐約成立的Runway AI發佈了一段用AI生成的影音：畫面模糊、卡頓，物體扭曲，僅時長4秒；四個月後，Runway將文生成影音的效果推向4K超高清，實現鏡頭的連貫穩定，長度也從4秒提升至18秒——這是2023年文生成影音的「時長天花板」。

然而，就在2024年2月16日凌晨，「時長天花板」被OpenAI再次打破，他們發布了能生成60秒影音的AI模型Sora。Sora的出現，預示著AI影音生成將迎來巨變。它不僅能根據文字指令創造出逼真且富有想像力的場景，還能生成長達一分鐘的影音並一鏡到底。

OpenAI表示，他們正在教導AI理解和模擬運動中的物理世界，目標是訓練模型來幫助人們解決需要現實世界互動的問題。隨後OpenAI解釋了Sora的工作原理，Sora是一個擴散模型，它從類似於靜態噪聲的視頻開始，通過多個步驟逐漸去除噪聲，視頻也從最初的隨機像素轉化為清晰的圖像場景。

Sora使用了Transformer架構，有極強的擴充性。視訊和圖像是被稱為「補丁」的較小資料單位集合，每個「補丁」都類似於GPT中的一個標記（Token），透過統一的資料表達方式，可以在更廣泛的視覺資料上訓練和擴散變化，包括不同的時間、解析度和縱橫比。

——引述《界面新聞》

可以說，隨著Sora的出現，我們正式踏入了文字生成影片的全新時代，在短短24小時內，這款革命性的產品已引起了廣泛的關注和討論。

身為數位內容製作人，又曾於內容產業工作逾八年，很難不關注這條新聞。出於對新工具的好奇，下面簡單爬梳了相關的內容，結合與朋友的討論，初步彙整訊息如下：

OpenAI的背景？

OpenAI作為人工智慧領域的先驅之一，一直致力於推動人工智慧的發展和應用。他們開發了許多引領潮流的技術和產品，如GPT系列文本生成模型。Sora的出現，再次展示了OpenAI在該領域的領先地位和創新能力。

Sora標誌的里程碑？

Sora可以根據用戶的文字提示生成長達一分鐘的高清影片，這在之前是無法想像的。它所生成的影片不僅極度逼真，還能涵蓋多個角色與多個場景，並帶入運鏡效果，使得生成的影片更加生動。這種技術的突破，意味著我們可以用更低的成本和更短的時間創造出高品質的影片，相關行業亦將帶迎來巨大變革。

Sora的技術厲害在哪？

Sora的強大之處在於其革命性的技術應用，基於Transformer架構，並使用更具擴展性的狀態空間模型（SSM）來生成高分辨率、逼真度極高的影音內容。Sora被認為是一個「世界模擬器」，具有多種有趣的模擬能力，包括3D一致性、長期一致性和對象持久性等。這使得Sora能夠直接在不同設備上創建內容，並展示出多樣的功能。

評論者表示，Sora像是一個數據驅動的物理引擎，能夠模擬各種世界，並通過學習複雜的渲染、物理特性和推理來生成高品質的影音。OpenAI也將其視為潛在的通用模擬器，認為擴展影音生成模型是一個有前途的途徑。

Sora將可能顛覆哪些行業？

Sora的出現將對需要大量的人力和時間等成本來製作影片的行業帶來重大變革，包含影視製作、廣告業、短影音等從業者與相關的大學科系——傳統的影視行業分工精細，但AI可以大幅簡化製作流程並降低成本；傳統的廣告公司也將面臨顛覆，因為AI技術能夠以更低成本提供類似甚至更好的效果；隨著AI技術的普及，短影音相關的行業將迎來更加激烈的競爭局面。此外，傳統藝術設計等相關科系將面臨市場需求下降，同時，畢業生的就業發展亦可能受到影響。

什麼樣的人可能被浪捲走？

生成式AI需要清晰明瞭的文字描述來產生內容，如果無法準確描述出所需的內容，可能會影響到最終的影音品質。對於傳統的影音從業人員而言，如果他們的語言能力或文字敘事能力不足的話，在面對生成式AI時可能會遇到困難。因此，對於從業人員來說，提升語言敘事能力將會成為重要的競爭優勢。

以上，老熊維尼如是說。

如何運用Sora創造新機會？

Sora的出現降低了影音作品製作的門檻，使得影音創作變得更加簡單。對於影視行業從業者而言，他們可以更加集中精力在故事與創意而非技術細節；對於一般使用者而言，他們無需專業技能即可生成各類影音內容，只需提供文字提示，這將幫助更多的創作者能以較低成本生產出優秀作品，進而帶來更靈活的發展空間。

顯然，具有較強文字能力的創意發想者更有機會成為這一波變革的獲利者。

普通人如何面對變革浪潮？

下面很精簡地摘要自非公開的資料來源，得到AI學習圈的〈4大行业将因OpenAI超强Sora模型变天，给你3条应对变革浪潮的小建议〉：

積極擁抱變化，成為AI領域的專家：面對變革，我們應該試著成為自己的交友圈與工作圈中最了解AI的人。透過學習和探索技術，開發新的技能，例如：利用AI製作旅遊遊記影音，或者成為AI時代的旅遊影音部落客。
想像自己是一家一人公司的創始人：想像自己註冊了一家一人公司，專注於解決某個領域的痛點或提供個性化服務。例如，利用AI技術為個人用戶提供定制化的PPT製作服務，將AI應用於文案撰寫、設計和排版。
保持好奇心，放大興趣：在AI普及的時代，建議保持好奇心，將注意力集中在自己感興趣且擅長的領域，並且多加利用技術補足自己的短板，更靈活地運用AI技術，提升創意表達和個人品牌建設的能力。

初步彙整至此，似乎應該有個小結尾。

那麼結尾就附上其他的參考資料啦：

Sylvie的移動城堡🪶好日子未完待續整理中的工具箱

留言

Sylvie的移動城堡

72會員

143內容數

我和我的日常觀察、讀書筆記，還有基於個人生活經驗的反思與體驗；我和你和他的互動、以及跨越不同社會關係網絡而激起的煙花、水花與火花。

Sylvie的移動城堡的其他內容

2024/04/07

Grammarly：英文寫作救星

因為工作的關係，時常在寫英文；而最近因為英語演講會的社團活動，寫英文演講稿的頻率更高了。這一年多下來，想分享一下一個超好用的外掛程式：Grammarly。雖然有ChatGPT，但是尚未能勝過的Grammarly。在網路上搜了一番，發現有人寫過類似的分享，如果是完全不認識Grammarly的人

2024/04/07

Grammarly：英文寫作救星

2024/03/29

如何準確指示AI生成你要的圖？

很快地，又來到了本週的說話時間。接續上星期的話題，這個星期我和洪七在聊天中討論的是，如何運用GPT製作有畫面、有意義、有衝擊感又有記憶點的節目封面圖。內含：如何規避版權問題？若不透過臨摹，不輸入原始圖片，該如何讓AI自己畫出超擬真圖片？聊到這件事的緣由是，我們自己的節目，起初是上傳到Firs

2024/03/29

如何準確指示AI生成你要的圖？

2024/02/21

如何加入Toastmasters？

從去年的八月開始，我便作為guest去旁聽了不同的分會，初步參與到他們的活動中，並藉此了解不同分會的特性與氛圍，累計參與過六個在台北各個地方的分會活動，其中有兩個是雙語分會（中英文隔週），四個是全英文分會。

2024/02/21

#AI 的其他內容

AI 浪潮下的「毀滅性創新」：解析湯森路透、納斯達克股價重挫的關鍵

與老查一起讀商業好書

當部屬用 AI 一小時完成你三天的工作量，主管如何重塑領導力？運用「情境領導」重新定義 AI 協作時代的管理

上游洞見

川普關稅 2.0 下的供應鏈重構

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品，以十段寓言式殘篇，重新拼貼記憶、暴力與美學，並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇：帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略，嘗試解析極權底下不可言說之事，將如何成為可被觀看的公共發聲。

#釀電影#釀評論#藝術評論

2026/01/14

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

#釀電影#釀評論#藝術評論

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

柏林劇團在 2026 北藝嚴選，再次帶來由布萊希特改編的經典劇目《三便士歌劇》（The Threepenny Opera），導演巴里・柯斯基以舞台結構與舞台調度，重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核，藉由沉浸與疏離的辯證，解析此作如何再次照見觀眾自身的位置。

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲．蓋柏樂》的詮釋，從劇本歷史、聲響與舞臺設計，到演員的主體創作方法，探討此版本如何讓經典劇作在當代劇場語境下煥發新生，滿足現代觀眾的觀看慾望。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

《轉轉生》為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，融合舞蹈、音樂、時尚和視覺藝術，透過身體、服裝與群舞結構，回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發，分析《轉轉生》如何以當代目光，形塑去殖民視角的奈及利亞歷史。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14