
嗨大家好,我是 Mech Muse 👋
今天要跟你分享一個我看到就忍不住想寫下來的故事——那種會讓人邊看邊想:「哇,AI 產業真的變了。」的新聞。
主角是兩位年僅 22 歲的 Gen Z 創業者。他們為了打造自己的 AGI 新創公司 Sapient Intelligence,竟然直接拒絕 Elon Musk 透過 xAI 開出的「數百萬美元」邀約!而且不是意氣用事,而是因為他們真的做出了能在推理任務上打敗主流大模型的新架構 HRM(Hierarchical Reasoning Model)。這篇文章,我會跟你一起:
- 先講清楚發生什麼
- 用時間線整理 Sapient 兩位創辦人的成長與公司歷程
- 延伸解釋 HRM 類腦架構到底厲害在哪裡(用很好理解的方式 ✨)
- 最後幫你整理幾個「值得記下的收斂點」
讓你看完後,不只知道這則新聞的「故事」,也能理解它為什麼重要。
兩位 22 歲創辦人對 Musk 說「不用了,謝謝」🤝
根據 Fortune 在 Brainstorm AI 2025 的專題報導,Sapient Intelligence 的兩位共同創辦人 William Chen 和 Guan Wang 在論壇上公開分享:
他們還在清華大學念書時,就收到 Musk 團隊 xAI 開出的「multimillion-dollar offer(數百萬美元級別)」,希望能合作或加入。
結果,他們 拒絕了。
補充一下背景:這兩位不是靠「故事」走紅,而是真的先做出成果。他們在大學時做出了一個小型開源模型 OpenChat,利用高品質對話資料搭配強化學習訓練,成績優異,甚至在某些測試上超越 LLaMA2 70B,因此很快在開源圈爆紅,也讓他們進入 Musk 的視野。
但他們最終還是選擇獨立創業,成立 Sapient Intelligence,總部直接設在 新加坡。
這家公司一開始就拿到 2200 萬美元種子輪,估值 2 億美元,投資方包含了 Vertex Ventures、住友商事、JAFCO 等一線資金。🔥
真正讓 Sapient 衝上全球科技媒體首頁的,是他們在 2025 年推出並開源的 HRM 類腦 AI 模型。
✨ 亮點來了:
這個模型只有 2700 萬參數、只靠 1000 多筆訓練資料,卻在:
- ARC-AGI
- 迷宮推理
- 高難度數獨
- 其他深度推理任務
上面 打敗 OpenAI o3-mini、Anthropic Claude 3.7、DeepSeek R1 等商用大模型。
HRM 的概念是:不是照 Transformer 那套「看前面猜下一個字」,而是模擬「大腦式思考」——分成慢思考(高層策略)+快思考(低層細節)的兩階層架構,讓模型在推理時真的像「在想」,而不是只在「predic t 下一個 token」。
簡單說:
他們不是做出另一個 GPT,而是在試著改寫 AI 的「思考方式」。
故事怎麼一路走到今天?Sapient 的完整時間線 ⏳
要理解他們為什麼敢拒絕 Musk,很值得看一下他們的成長軌跡。
🔹 高中:在美國密西根相遇,聊的是「大目標(metagoals)」
兩位創辦人在美國密西根高中認識,是那種會一起討論人生方向與技術挑戰的好朋友。
- Wang 的人生主題是:打造能解決任何問題的演算法
- Chen 的志向是:用工程方法優化人類系統
兩人從那時起,就是在看「更大的問題」。
🔹 大學:一起到清華,做出 OpenChat
高中之後,他們一起到北京清華大學念書。一開始課業負擔很重,但在教授支持下開始做更大的專案,並成功打造 OpenChat ——一個引爆開源圈的小型 LLM,甚至在部分測試上超越 LLaMA2 的大型模型。
這是他們第一次站上國際舞台。
🔹 收到 xAI 的百萬美元級邀約 → 選擇拒絕
OpenChat 造成關注後,Musk 團隊出手接觸,開出「multimillion-dollar offer」。
但兩人覺得他們對 AGI 的節奏、方法、風險評估,都與巨頭不同。他們希望能完整掌握方向,而不是成為巨頭的一部分。
因此選擇自己創業。
🔹 2024:在新加坡創立 Sapient,拿下 2200 萬美元種子輪
Sapient Intelligence 成為「新加坡第一家基礎模型 AI 新創」。與其說是 LLM,他們更專注於「新一代 AGI 架構」。
資金後援非常亮眼,讓他們得以建立完整研究團隊。
🔹 2025:HRM 上線 → 引爆全球
2025 年 6 月,HRM 論文上傳 arXiv。這個架構的核心是兩階層循環網路(慢規劃 + 快推理),搭配自適應推理時間。
模型表現驚人,在推理基準上一口氣打敗多家主流商業模型。
7 月正式開源,GitHub 星數很快破萬。
🔹 2025 年底:站上 Fortune Brainstorm AI,完整公開故事
11 月,他們在新加坡舞台上第一次對全球觀眾公開「拒絕 Musk」的過程,也因此成為全球科技界最受關注的新創故事之一。
他們到底在賭什麼?HRM 類腦架構 + AI 人才主導權的大轉向 🧩
這則新聞最有趣的,不只是拒絕 Musk,而是背後的兩個關鍵趨勢:
1)HRM:不是「模型變大」,而是「把 AI 的思考方式改寫」🧠⚙️
大部分的 LLM 都是 Transformer,自回歸預測下一個 token。
但這種方式天生不擅長:
- 多步驟推理
- 搜索型問題(迷宮、數獨)
- 需要動態規劃的任務
HRM 的做法是:
- 高層:慢規劃(像人腦的 System 2)
- 低層:快運算(像 System 1)
模型可以「多想幾輪」,並動態調整思考時間(Adaptive Computation Time)。這讓它在深度推理上真的很強。
這件事的象徵意義是:
👉 不是所有進步都要靠「堆更多 GPU」
👉 架構創新回到舞台中心
👉 小模型反而可能比大模型更有效率
未來機器人、邊緣設備、低延遲應用,都會超級需要這種架構。
2)說「不」給 Musk:AI 人才的籌碼正在大幅位移 🔥
過去,想做 AGI 的人才幾乎都得進入:
- OpenAI
- DeepMind
- Meta FAIR
- Anthropic
但這兩年情況變了。
因為:
- Mistral、Anthropic 等新創證明:小團隊也能挑戰巨頭
- Capital 進入很快,優秀技術團隊可以直接拿到高估值
- 開源社群成為「另類力量場」,能快速放大技術影響力
所以像 Sapient 這樣:
技術 → 社群影響力 → 資金 → 自由度 → 自己掌握 AGI 節奏
成為一條「新的 AI 人才路線」。
兩位 22 歲創辦人之所以敢拒絕 Musk,是因為:
🤝 他們不再是「受雇者」,而是「技術持有人」
🤝 他們手上真的有別人沒有的東西(HRM)
🤝 這個時代給了技術人才更多可以「自己設計賽局」的空間
這才是這則新聞最值得記下來的地方。
Sapient 給我們的三個提醒📌
最後幫你整理三個我覺得關鍵的 takeaway:
1)架構創新重新變重要
不是只有「模型變大」才能進步。HRM 展示的是:
小模型 + 聰明架構 + 好的訓練策略
也能在特定任務上擊敗巨頭模型。
2)AI 人才的選擇比以往更多
不是只有進大公司一條路,真正有能力的人:
可以自己組團隊、自己拿資源、自己跑策略。
3)AGI 不是只比「速度」,還比「你想用什麼方式到達」
創辦人提到的「Pandora 盒子」提醒了我們:
AGI 的重要問題,不只在技術,也在價值觀、節奏與負責任的態度。
這些都讓 Sapient 的故事不只是「拒絕 Musk」的爽文,而是一個值得收藏的案例。
如果你喜歡這種 把新聞講清楚,再補上趨勢脈絡 的內容,
歡迎在方格子追蹤我 Mech Muse 👋!
之後還會帶你一起追更多 AGI、新創、類腦架構、人型機器人等有趣又重要的科技趨勢~ 🚀✨





















