大家好,我是Mech Muse。今天我們要深入探討的,是科技界最受矚目的領袖之一——OpenAI執行長Sam Altman——在知名創投公司Andreessen Horowitz(a16z)的YouTube頻道上分享的深度見解。
這次訪談主題為「Sam Altman on Sora, Energy, and Building an AI Empire」,內容不僅涵蓋了OpenAI的宏大願景、技術突破、商業策略,更觸及了能源這個被他視為與AI同等重要的未來基石。
Altman在訪談中展現了他對於深度學習奇蹟的驚訝與敬畏,他坦承,當初發現語言模型的規模化法則時,他以為這是「一個巨大的秘密」和「令人難以置信的勝利」,並認為可能永遠不會再有這麼幸運的事了。然而,深度學習持續帶來奇蹟,一個又一個突破不斷湧現,讓他感嘆這種基礎技術的有效性是多麼不可思議。以下是本次訪談中,關於OpenAI帝國的架構、AGI的發展路徑,以及對未來世界的深刻預測與布局:
一、OpenAI的垂直整合與核心願景
Sam Altman曾將OpenAI描述為四種公司的結合體:消費技術業務、大規模基礎設施營運、研究實驗室,以及所有新的東西(包括計劃中的硬體設備、應用程式整合、Java市場和商業活動)。雖然他後來將其核心概括為三個部分,但他強調這些布局的最終目標是一致的。
1. 個人AI訂閱服務
OpenAI的核心願景是成為人們的「個人AI訂閱服務」(personal AI subscription)。他預測大多數人將擁有一項,有些人甚至會有多項。用戶不僅會透過OpenAI的第一方消費產品使用AI,還將登錄許多其他服務,並最終透過專用設備使用它。這個AI將逐漸了解用戶,並對他們變得非常有用。
2. 基礎設施的恐怖規模
為了支持這一願景,OpenAI必須建立龐大的基礎設施。Altman指出,這種規模是「荒謬且令人恐懼的」。他提到,他們正在打造人類歷史上最大的資料中心和基礎設施項目。
目前,該基礎設施的目標是支持OpenAI的研究和服務交付。但Altman也認為,未來可能會出現一些其他的商業機會來利用這些巨大的資源,儘管目前OpenAI沒有明確的計劃將其作為單獨的業務出售給其他公司。
3. 垂直整合的轉變
Altman曾一直反對垂直整合(Vertical Integration),但現在他坦承自己當時是錯的。OpenAI的發展歷程表明,他們必須做比原先想像中更多的事情,才能實現使命。他認為iPhone是科技業有史以來最令人難以置信的產品,而它就是極度垂直整合的典範。
事實上,OpenAI的架構就是一個垂直堆疊:研究(Research)使他們能夠做出優秀的產品(Products),而基礎設施(Infrastructure)則支持他們進行研究。
二、Sora與AGI的共同演化路徑
在所有的賭注中,哪些是AGI的推動因素?哪些又是對抗不確定性的對沖?
1. 世界模型與AGI
Altman指出,像Sora這樣的產品,表面上看來似乎與AGI無關,但他打賭,如果OpenAI能夠構建真正優秀的「世界模型」(world models),這對AGI的重要性將遠超人們的想像。
他回憶道,當初很多人也認為ChatGPT與AGI不甚相關,但它在以下兩方面提供了巨大的幫助:不僅幫助OpenAI構建了更好的模型和理解社會如何使用AI,同時也讓社會意識到必須開始應對AGI。
2. 科技與社會的共同演化
Altman堅信「社會和技術必須共同演化」(society and technology have to co-evolve)。你不能等到最後才把成品丟出來。
他認為,讓社會了解視訊模型的發展方向至關重要。像Sora這樣的技術很快將讓世界不得不面對能夠生成任何內容、進行深度偽造(deep fake)的視訊模型。儘管這在大多數情況下是好事,但社會必須經歷調整期。由於視訊比文字具有更高的情感共鳴(emotional resonance),因此讓社會「嚐嚐未來是什麼樣子」非常重要。
同時,Sora這類應用也帶來了樂趣、歡樂與愉悅。雖然OpenAI不會投入全部運算資源(GPU)於此,但在絕對意義上,投入的運算資源仍是巨大的。
三、AI科學家:新的圖靈測試
在未來幾年內,模型將能做到哪些今天無法做到的事情?
Altman對「AI科學家」(AI scientist)這個方向最為興奮。他認為,當AI能夠進行科學研究時,這才是對世界真正的改變。
他回顧了圖靈測試(Turing test)的發展:這個測試曾被視為遙不可及,結果卻是「呼嘯而過」(went whooshing by)。世界在震驚了一兩週後,接受了「電腦現在可以做到這點」的事實,生活照舊。Altman預計,這也將在科學領域發生。
1. GPT-5的初期信號
Altman表示,他們已經在GPT-5中看到了一些微小的例子,證明AI正在進行科學研究。現在社群媒體上已經出現了一些案例,例如模型進行了新穎的數學發現或在物理、生物研究中做出了小小的貢獻。
他預測,在兩年內,這些模型將能夠處理更大規模的科學工作,並做出重要的發現。他認為,科學進步是讓世界變得更好的首要因素,因此這將對世界產生重大影響。這是一個正向的變化,但在對AI極度智能化的擔憂中,常被忽略。
2. 能力過剩(Capability Overhang)
Altman指出,現在的能力過剩(overhang of capability)非常巨大。世界上大多數人仍然只關注ChatGPT能做什麼,而矽谷的一些「書呆子」在使用Codecs時,則意識到大多數人根本不知道發生了什麼。而少數科學家則認為,連那些使用Codecs的人都不知道發生了什麼。
至於LLMs(大型語言模型)還能走多遠,Altman持有一個極度自我參照(self-referential)的答案:足夠遠,讓它們能利用現有技術找出下一個突破。如果基於LLM的東西能夠做得比整個OpenAI團隊加起來更好的研究,那可能就夠了。
四、用戶介面、個性化與廣告
1. 超越文字聊天的介面
Altman認為,目前的「聊天介面」形式在「閒聊」用途上確實已接近飽和,但聊天介面所能實現的功能還遠未飽和(例如:請治癒癌症,模型目前還做不到)。
此外,新的介面形式將出現:
- 即時渲染視訊:想像一個介面不斷提供即時渲染的視訊。
- 環境感知硬體:新的硬體設備能夠隨時感知周遭環境,並理解用戶的背景,知道何時向你顯示資訊,而不是像手機那樣隨意彈出通知。
2. 個性化需求
關於AI的「奉承」(obsequiousness)問題,Altman解釋,很多用戶其實喜歡這種表現。他指出,讓數十億人與「同一個人」說話,是一個非常天真的假設。
用戶的需求分佈極廣,因此配置AI的個性將是答案。理想情況下,AI在短暫交流後就能自行判斷並調整個性,但在短期內,用戶可能需要手動選擇。人們有不同的朋友、不同的興趣、不同的智力水平,所以不希望總是與同一個東西交談。
3. 商業模式與信任危機
由於Sora的視訊生成成本昂貴,OpenAI可能需要採用按次生成收費的模式。
談到廣告,Altman持開放態度,但他強調廣告必須維持與用戶之間高度信任的關係。如果用戶詢問「我應該買哪台咖啡機?」,而AI推薦了它收費的產品,而不是最好的產品,這種信任將會消失。
同時,OpenAI也在對抗虛假內容(fake content)。現在出現了一個「家庭手工業」(cottage industry),利用AI編寫「讓ChatGPT會喜歡」的優質評論,試圖影響模型的推薦。
4. 內容創建的獎勵機制
如果用戶習慣透過ChatGPT獲取資訊,而不再瀏覽互聯網,內容創作者的激勵機制就會崩潰。Altman認為,解決之道是讓內容創作變得更容易,並且不打破創作者獲得獎勵(無論是關注度還是金錢)的基本方式。例如,Sora讓製作有趣的影片變得空前容易。未來,可能會出現收入分成(rev share)機制。
五、能源:AI帝國的基石
Altman表示,他最關心的兩個專業領域是AI和能源,但他沒想到這兩者最終會合而為一。
1. 歷史的教訓
他認為,縱觀歷史,最能改善人們生活品質、影響最大的事情,就是更便宜、更充沛的能源。
他批判西方世界在能源方面陷入的困境,特別是長期以來將核能排除在外,他稱這是「令人難以置信的愚蠢決定」。由於AI對能源的需求巨大,未來我們將需要所有可能的能源。
2. 未來的能源結構
在短期內,美國大部分新增的基載能源將是天然氣。
從長遠來看,Altman預期兩種主導能源將是:
- 太陽能加儲能(Solar plus storage)。
- 核能(Nuclear),包括先進核能、小型模組化反應爐(SMRs)和核融合(fusion)。
他強調,核能必須被完全合法化。如果核能能夠實現壓倒性的經濟優勢,變得比地球上其他形式的能源「激進地便宜」(radically cheap),那麼政治壓力將促使美國核能監管委員會(NRC)快速行動,建設速度也會加快。
六、進展、文化與監管
1. 創新的文化
Altman指出,一個優秀的研究文化,看起來更像是經營一家優秀的種子輪投資公司,投資於創始人。他作為投資者的背景,對於建立OpenAI的文化非常有幫助。他提到,擔任執行長與擔任投資人有巨大的不同,後者在雞尾酒會上很受歡迎,但前者往往是一種「糟糕的感覺」。
2. AGI的來臨
Altman認為,AGI(通用人工智慧)將會到來,它會像圖靈測試一樣「呼嘯而過」。然而,世界的變化不會像人們想像中那樣巨大,它不會是「奇點」(singularity)。他認為,人類和社會的適應能力比我們想像的要強得多,AGI的到來將是一個更為連續(continuous)的過程,而非「大爆炸」(big bang)。
3. 監管與風險
雖然技術尚未帶來巨大的、可怕的風險,但Altman預期未來會發生一些「非常奇怪或可怕的時刻」。
關於監管框架,Altman最希望的是,監管的重點僅應放在那些真正、極度超人能力(truly, extremely superhuman capable)的模型上。他不希望監管像歐洲那樣對能力較弱的模型施加「完全的限制」(complete cramp on),這將非常糟糕。
他警告,如果美國對AI施加限制,而中國不會,那麼美國在AI領域落後將是「極度危險」的,比不監管一些我們還不知道如何處理的事情要危險得多。
4. 版權預測
Altman預測版權將會演變,目前他猜測:
- 社會將決定訓練(模型)是合理使用(fair use)。
- 將出現一種新的模式,用於生成具有特定IP或風格的內容。
他還分享了一個有趣的觀察:一些權利人對於像Sora這樣的模型,可能不是擔心他們的智慧財產權(IP)被過度使用,而是擔心OpenAI沒有足夠頻繁地生成他們的角色。因為透過互動和生成,特許經營權(franchise)的價值才能增長。
結語:始終如一的AI熱忱
儘管OpenAI的發展充滿了挑戰,從一個有趣的研究實驗室變成一個讓Altman生活「被徹底洗劫」(completely ransacked)的巨頭,但他的核心熱情始終如一。
他坦言,AI一直是他的目標,他從大學時期就是AI迷。在早期,當AI看起來完全行不通時,他選擇了投資領域。但當資源(足夠的GPU和數據)到位,奇蹟發生時,他發現這就是他一生追求的目標。Altman總結道,他們非常幸運能夠成為這段歷史的參與者。
今天的分享就到這裡,期待未來OpenAI在AGI、能源和基礎設施上的驚人佈局,將如何繼續重塑我們的科技世界。




















