"That's one small step for a man, one giant leap for mankind."
「這是一個人的一小步,卻是人類的一大步。」-尼爾.阿姆斯壯
OpenAI在2023年繼Runway公司推出文字轉影片的生成式AI模型Gen-2之後,最近又發表了全新的生成式AI模型Sora,使用DALL-E3生成模型,可將文字敘述指令轉化為長達一分鐘影片。 Sora不僅能從文字生成影片,還能將圖片轉化為影片,或者在現有影片基礎上生成新的影片內容。Sora支持影像解析度範圍廣泛,從最高的1920x1080,到垂直1080x1920,若針對單一frame進行操作,最大可達2048x2048解析度的圖像輸出,能夠將現有的圖片或影片縮放,並自動生成其他細節。
一年前 AI 影片生成技術:
2024 2月 Open AI Sora 生成技術:
Sora能夠產出的最小格式為一張2048x2048解析度的圖片,而最大則能輸出60秒長、1920x1080解析度的影片,檔案大小從數MB到數百MB不等。相比於ChatGPT主要輸出文字數據(數KB至數MB),檔案大小大約有10到100倍的差異(1MB=1,024KB)。當使用者透過Sora生成影片時,不僅資料中心內部伺服器與GPU間的運算流量會顯著增加,從Sora下載影片與用戶端上傳至其他影音平台也會大幅提升網路資料流量,推升資料中心、資料傳輸等龐大的需求。
因應這項跨時代新技術,業界預估未來將有更大需求的高速光收發模組,及更先進的大數據傳輸技術,以滿足龐大資料互動的需求。這不僅會推動網通設備傳輸等基礎設施的需求,也有望讓CPO光電共封裝技術成為資料中心大量採用的一種模式。雖然有關於AI取代演員與媒體創作著的玩笑話,但真正的挑戰和機遇在於如何利用這些先進技術,促進創新效率並且提升產出內容的品質。