Deepfake as A Service(DAAS): SORA, 最近AI界的紅話題, 眼見不一定為憑!

發佈於AI領域展開等個房間

更新於 2025/02/28發佈於 2024/03/01閱讀時間約 5 分鐘

Sora 是一個 AI 模型，可以根據文字指令創建現實且富有想像的場景。Sora 可以產生長達一分鐘的Video。

官網上的幾個例子:

Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.

請點選看上面文字內容影片。

Prompt: A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.

點選看影片。

Prompt: This close-up shot of a Victoria crowned pigeon showcases its striking blue plumage and red chest. Its crest is made of delicate, lacy feathers, while its eye is a striking red color. The bird’s head is tilted slightly to the side, giving the impression of it looking regal and majestic. The background is blurred, drawing attention to the bird’s striking appearance.

看影片。

prompt: A Chinese Lunar New Year celebration video with Chinese Dragon.

影片

官網說該模型對語言有深入的理解，使其能夠準確地解釋提示並產生引人注目的特色元素來表達充滿活力的情感。Sora 還可以在單一生成的影片中做出多個鏡頭，準確保留角色和視覺風格。

但也存在"沒有因果關係"的缺點。例如，一個人可能咬了一口餅乾，但之後餅乾可能沒有咬痕。還有空間感錯置等等等的問題。

例如奶奶吹蠟燭，蠟燭聞風不動。

動物或人無中生有。

要達到這些結果的背後需要幾個技術的結合，包括像是把圖像(高維度)降階為低維度的資料進行相關後續的訓練程序。

然後透過diffusion model，生成圖像。Sora 是一個diffusion transformer。過去已經有許多研究了各種方法對視訊資料進行生成的模型，像是recurrent networks, generative adversarial networks, autoregressive transformers, diffusion models等等等。這些作品通常專注於一小類視覺數據、較短的影片或固定大小的影片。Sora 官方宣稱自己是視覺資料的通用模型，它可以產生跨越不同的持續時間、長寬比和解析度的影片和影像，最多可達一分鐘的高清影片。將視覺數據轉化為一系列的連續影片。

他們利用一個降低維度的視覺資料訓練出一個神經網路。此網路將原始視訊作為輸入，並輸出包括時間和空間上的資訊。Sora以這樣的資料來訓練模型(潛在空間的向量運算)，並且也訓練了對應的解碼器(decoder)模型，將產生的latents 映射回像素空間。

潛在空間（latent space）可以用下圖的三維潛在空間來做說明:

上面只是為了讓人類容易理解的三維空間，兩點在潛在空間中的位置越近，則代表圖片也就越相似，跟詞向量空間接近，在潛在空間中朝特定方向移動也是有意義的，例如順著 x 軸的箭頭代表人臉有沒有戴眼鏡;z 順著 y 軸的箭頭移動會看到年齡的變化;z 順著 z 軸的箭頭移動則代表性別的變化。真正的潛在空間是n維的，但不管幾維，他們就是順著這樣的理論在做事的。對基礎理論有興趣的讀者，不妨可以買本書來提升一下功力，在我們的Ref中可以參考。

總結，Sora結合了圖像的diffusion跟文字的transformer成功製造了Video的GAN模型，我們離駭客任務的世界，越來越近了。以後，所見不一定是所得，DAAS已經在身邊。

Ref.

https://openai.com/research/video-generation-models-as-world-simulators

https://www.books.com.tw/products/0010901055

#OpenAI

#Sora

#AI

iBonnie_愛邦尼AI領域展開iBonnie_愛邦尼AI雜技(記)

留言

留言分享你的想法！

iBonnie_愛邦尼

6會員

81內容數

記錄生活與技術的小細節

iBonnie_愛邦尼的其他內容

2025/04/18

還在chain of thought prompting?不學Chain of Draft (CoD)你就落伍了!-免費

大型語言模型（LLMs）已透過「思維鏈（Chain-of-Thought, CoT）」提示技術大幅提升其複雜推理能力。儘管 CoT 在提升準確性方面成效顯著，但其冗長的輸出方式也帶來了高昂的計算成本與顯著的延遲。這在講求效率的真實應用場景中，往往成為導入障礙。🧠 Chain of Draft

含有成人內容

2025/04/18

還在chain of thought prompting?不學Chain of Draft (CoD)你就落伍了!-免費

含有成人內容

2025/04/17

打造強大自主 AI agent代理系統的關鍵組合：LangGraph + MCP + Ollama

本文提供 LangGraph、MCP（Model Context Protocol）與 Ollama 整合的實作教學，示範如何快速構建多代理聊天機器人系統。文章涵蓋 MCP 的優缺點、與 Function Call 的比較、應用場景選擇，以及逐步的實作步驟。

2025/04/17

打造強大自主 AI agent代理系統的關鍵組合：LangGraph + MCP + Ollama

2025/03/27

AnythingLLM 與 Ollama：簡化大型語言模型應用程式與部署

AnythingLLM 是一款簡化大型語言模型應用程式的強大工具，支援多種文件格式、多人使用和管理，並提供彈性的 LLM 和向量資料庫選擇。同時，它也提供網頁文字爬取和 YouTube 字幕擷取等功能。本文介紹Docker 架設方法，並提供設定步驟與使用範例，例如建立一個會議紀錄小祕書。

2025/03/27

AnythingLLM 與 Ollama：簡化大型語言模型應用程式與部署

看更多

你可能也想看

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

孩子寫功課時瞇眼？小心近視！這款喜光全光譜TIONE⁺光健康智慧檯燈，獲眼科院長推薦，網路好評不斷！全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉，讓孩子學習更舒適、保護眼睛！

#方格新手#保護眼睛#閱讀

2025/06/21

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

#方格新手#保護眼睛#閱讀

2025/06/21

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

#vocus#方格子#求職

2025/06/23

你好，我是作家P先生

[其他][003] AI 時代來臨，我我我我該怎麼辦?　

那天看到OPENAI SORA的新功能出來，不看不知道，一看嚇一跳啊！又看到這篇的分析(請點我)，不免深深覺得，難道這又是另一個時代的終止和另一個時代的開始了嗎？那我們該做些什麼呢? 或者，我們什麼都不用做呢？

#AI

2024/05/01

你好，我是作家P先生

[其他][003] AI 時代來臨，我我我我該怎麼辦?　

#AI

2024/05/01

A-rod的沙龍

做設計的人 179篇變與不變

Open AI影片生成模型Sora橫空出世 Sora是一個 AI 模型，可依據文字指令創建現實和富有想像的場景這是Open AI首頁關於生成模型Sora的簡介 Open AI執行長將籌資數兆美元重塑全球半導體產業全美娛樂產業接受訪談的300位主管，認為未來3年將有20萬個工作受到AI

2024/03/25

2024/03/25

關於 SORA 技術原理的圖像式解說，內容從通用型人工智慧到生成運算的原理以及相關的技術研究成果。提供了使用生成運算方式的 Diffusion Transformer 介紹和進階閱讀的指路。分享 AI 研究領域的開放性和合作精神，以及對視覺產業可能帶來的影響。

2024/03/18

2024/03/18

Deepfake as A Service(DAAS): SORA, 最近AI界的紅話題, 眼見不一定為憑!

Sora 是一個 AI 模型，可以根據文字指令創建現實且富有想像的場景。Sora 可以產生長達一分鐘的Video。官網上的幾個例子: Prompt: Several giant wooly mammoths approach treading through a snowy meado

#OpenAI#Sora#AI

2024/03/01

iBonnie_愛邦尼

Deepfake as A Service(DAAS): SORA, 最近AI界的紅話題, 眼見不一定為憑!

#OpenAI#Sora#AI

2024/03/01

路易老闆的品牌子彈學的沙龍

一夜之間震撼世界的 Ai 影片 - SORA讓你懷疑身處虛擬還是現實

如果AI能夠生成高質感的影片，對影視業不啻一場革命。無需龐大設備和龐大後製團隊，只需要指令，幾分鐘即能輕鬆完成。這對影視業來說無疑是一場革命。

#影視#品牌#創意

2024/02/20

路易老闆的品牌子彈學的沙龍

一夜之間震撼世界的 Ai 影片 - SORA讓你懷疑身處虛擬還是現實

#影視#品牌#創意

2024/02/20

每日發車

筆記-股癌24.02.17

股癌24.02.19 *OPEN AI鴨子划水，推出文字轉影片的AI模型Sora。 Sora對物體世界有認知，有望成為真正的世界模型，真正教會AI世界運作的道理，AI教會人類手指動作、玻璃碎掉、光影反射的物理狀況。 --之前的文字轉影片背景會一直閃、因為模型還沒有算得很準。 *Sora相較

2024/02/19

2024/02/19

OpenAI 發表的Sora，對於我這個浸淫AI繪圖還有AI產生(基礎的)動畫一段時間的人來說，可以說是非常的震撼。為什麼Sora 跟其他的文字產生影片的工具如Pika 或是 Runway 完全不同呢? 他對我們來說又有什麼意義呢? 這就是這篇文章我們想探討的。

2024/02/18

技術PM路易斯的沙龍

OpenAI的Sora為什麼重要?

2024/02/18

莊凱仲 Ivan的沙龍

什麼是Sora？Open AI生成影片釋出，真真假假須臾之間。

AI生成技術領頭羊Open AI又出手了，旗下產品「Sora」有別於Chat GPT，只要給予指令，生產出來的不再只是文字，而是一幕幕需要耗費大量人工努力下產出的產品，所謂大量人工包含了：攝影、剪接、燈光、彩妝、演員、美術道具，甚至導演、製片等等。而AI只要彈指之間，便能將無形化有形，從無到有

#OpenAI#AI生成影片#生成式AI

2024/02/18

莊凱仲 Ivan的沙龍

什麼是Sora？Open AI生成影片釋出，真真假假須臾之間。

#OpenAI#AI生成影片#生成式AI

2024/02/18

AI.ESG.數位轉型顧問沈重宗

OpenAI最新推出的「Sora」是一款文本生成影像的AI模型，只要輸入幾句簡單的文字描述，就能自動生成出影像，影片內容可以包含多名角色，搭配特定的動態場景，且影片長度最高可達60秒，同時還能展示複雜的攝影機運動。Sora還能夠根據靜態圖片來製作動畫，功能十分強大。目前Sora還沒有開放給大眾使

2024/02/17

AI.ESG.數位轉型顧問沈重宗

2024/02/17

賴仕涵的思考王國

💟從OpenAI全新發表的「AI生成影片」技術（Sora），反思「AI生成美女圖」可能造成之衝擊

幾天前OpenAI公司發表了全新的「AI生成影片」技術：透過一段簡短的「文字」敘述，讓AI生成一分鐘、1080P畫質的精美逼真影片。礙於能力時間有限，我只能從使用ChatGPT、Bing這一年來獲得的大量經驗，閱讀研究大量AI相關資料整理的結論，分享AI生成圖片影片對「親密關係」可能帶來的衝擊。

#OpenAI#AI生成圖片#AI生成影片

2024/02/17

賴仕涵的思考王國

💟從OpenAI全新發表的「AI生成影片」技術（Sora），反思「AI生成美女圖」可能造成之衝擊

#OpenAI#AI生成圖片#AI生成影片

2024/02/17

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News