OpenAI Sora 將改變影視創作產業?AI 模型是否會被大公司壟斷?

2024/02/21閱讀時間約 2 分鐘


OpenAI 推出新的模型 - Sora


OpenAI Sora 介紹

2024 年 2 月,OpenAI 推出了 Sora 文字生成影片模型,該模型根據用戶輸入的文字描述生成逼真的影片,並且能夠控制影片的細節,例如人物、場景、動作、表情等。一推出就受到廣泛的討論,也代表人類在 AI 領域的重大突破。

OpenAI Sora 透過文字產生的影片:


OpenAI Sora 技術說明

Sora 建立在 DALL-E 2 圖像生成模型的基礎上,DALL-E 2 模型可以根據用戶輸入的文字描述生成圖片,Sora 融合了 ChatGPT 的 Transformer 技術和 Diffusion 技術,在平面圖片的基礎上增加了空間與時間的概念,使得動態物件在不同時間點保持高度一致性,達到專業攝影效果。


OpenAI Sora 影響

Sora 的出現無疑為影視創作領域帶來了革命性的變化,任何影視創作 (電影、YouTube)都可以使用 AI 生成技術來創造複雜的視覺效果,甚至是生成完整的動畫短片,這不僅降低了創作門檻,更重要的是創作成本也會大幅下降。

儘管在 Sora 目前還有一些缺點,像是難以正確的模擬複雜場景的物理原理,也無法理解因果關係的具體實例,例如:一個人可能咬了一口餅乾,但下一秒餅乾沒有咬痕。但是模型會隨著時間改進,Sora 依然展現了在影視創作領域巨大的潛力和可能性。


AI 模型是否會被大公司壟斷?

我認為會的,原因如下

  1. AI 模型的泛化能力提高了,一種模型可應用到多個領域
    以 ChatGPT 來說,用戶可以客製化需要的 ChatGPT 聊天機器人,幫助完成特定需求的工作,並且在 ChatGPT Store 中可以找到各式各樣的 ChatGPT,例如:旅遊、書籍、設計等等不同領域的 ChatGPT。目前有些新創公司基於 ChatGPT 做出的產品功能,如 ChatGPT律師版、ChatGPT醫生版,在 ChatGPT Store 內就可以找到類似功能的 ChatGPT,這些公司未來被取代性高。
  2. 技術與訓練資料的積累
    訓練模型不僅需要海量的數據,訓練時所需要的算力也非常可觀,目前公佈的 GPT-3 有 1750 億個參數,要訓練如此龐大的模型,所需要費用與資料量都不是一般公司可以負擔的,導致未來最精準的模型可能只會是自幾個科技巨頭。


AI x Data Science 探討 AI 大小事
留言0
查看全部
發表第一個留言支持創作者!