思維外掛|AI 為什麼只能在封閉系統中可靠?|AlphaStar × 資料中心

更新 發佈閱讀 5 分鐘

從《星海爭霸》到 Google 資料中心:AI 如何走入現實世界的決策控制

課程背景

在 UC Berkeley CS294-196 (Fall 2025) 的課程中,Clay Bavor(Google 前副總裁、Sierra 共同創辦人)分享了他在 Google 生態系中,如何將研究團隊的成果轉化為可實際部署系統的經驗。這不僅是關於 AI 的演進,更是關於「如何讓 AI 在複雜系統中變得可靠」。


raw-image

如果你是《星海爭霸》(StarCraft II)的玩家,會對這段歷程感到格外親切;但即便不是玩家,也能從中理解 AI 從「遊戲行為」轉向「工業控制」的關鍵思維。

📌第一階段:AlphaStar 的技術突破

AlphaStar 是 DeepMind 於 2019 年發表的系統。與早期解決棋類遊戲的 AlphaZero 不同,AlphaStar 面對的是一個更接近現實的環境:高度複雜、不完全資訊、且為即時(非回合制)決策。

為了克服這些難題,AlphaStar 引入了核心機制:

聯盟訓練(League Training): 讓多個 Agent 彼此競爭,而非僅僅自我對弈。

剋星策略(Exploiters): 專門訓練一批 AI 來找現有最強策略的弱點,強迫系統不斷演化。

穩健性(Robustness): AlphaStar 顯示的關鍵點在於:在複雜系統中,單一的最優解通常是脆弱的,必須透過對抗訓練來培養在各種極端情境下(Corner Cases)都能存活的穩健策略。

AlphaStar 顯示,在高度複雜的對抗系統中,單一自我對戰容易收斂到脆弱策略,必須透過多樣化對手與刻意設計的對抗壓力,才能學到穩健行為。


📌第二階段:將技術「接地」——從電競到資料中心

看著AlphaStar 在遊戲內行雲流水,我的腦袋不禁思考:AI 這麼強,為什麼還沒變成 AGI(通用人工智能)?

雖然資料中心冷卻控制在時間線上早於 AlphaStar,且由不同的團隊負責,但它們在 Google 的 AI 發展史中共同指向同一個里程碑:做出在特定控制指標上,比人類經驗法則更穩健的決策。

關鍵在於「環境的邊界」。 StarCraft 是一個雖然複雜,但規則固定、可被高度工程化模擬的封閉系統。而在現實生活中,資料的混亂程度與使用者的隨機性,使得 AI 容易顯得「傻里傻氣」。

共通的訓練邏輯:

可建模的物理系統: 資料中心的溫度、電力負載與設備狀態可以被精準建模,形成一個「封閉且可模擬」的環境,這與遊戲引擎如出一轍。

長期策略大於即時優化: 冷卻控制不是只看當下的溫度,而是要預測未來負載對系統的影響。這與星海爭霸中的「長程布局(Long-horizon planning)」邏輯一致。

追求穩健而非投機: 就像 AlphaStar 要防範對手的怪招,冷卻系統必須在熱浪、設備故障或負載激增時依然保持安全,這就是「策略學習(Policy Learning)」的威力。

這種對複雜環境的『策略學習』,可能正是今日企業級 Agent 邁向實用的前身。


📌第三階段:AI Agent 的未來——Sierra 的企業級願景

Clay Bavor 離開 Google 後創辦了 Sierra,目標是將這套「可靠、穩健」的 Agentic AI 帶入企業環境。

Sierra 的核心產品是企業級 AI Agent 平台,在設計哲學上,它與 AlphaStar 的精神是一脈相承的:

Agentic Workflows(多步驟任務): 不再只是對話,而是像打星海一樣,能執行跨系統的長流程決策。

嚴格的 Policy(行為準則): 借鑒工業控制的經驗,為 LLM 設定嚴格的「護欄」,確保 AI 不會因隨機性而產生幻覺或違規。

可信任的部署: 它的目標不是讓 AI 看起來「更聰明」,而是讓 AI 在充滿變數的企業環境中,像冷卻系統一樣在明確邊界內可預期、可監控且可信賴。

---

前一陣子好忙~ 我回來啦 😚😚😚

留言
avatar-img
快樂,但可疑
2會員
13內容數
我在觀察人類,也在觀察人與AI的情緒互動。 兩者都在學習如何「理解情緒」——只是速度不同。 我寫自我覺察,也寫人機互動的覺察; 也許我們都還在同一堂「成為自己」的課上。
你可能也想看
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
Google 在台北士林啟用「美國以外最大」的 AI 硬體工程中心,主要負責 TPU 與 AI 伺服器系統整合,研發成果將部署到全球資料中心。這次投資延續 Google 在台布局近 20 年的發展,強化台灣在 AI 供應鏈與資料中心架構中的關鍵角色,也讓台美科技合作進入更緊密的新階段。
Thumbnail
Google 在台北士林啟用「美國以外最大」的 AI 硬體工程中心,主要負責 TPU 與 AI 伺服器系統整合,研發成果將部署到全球資料中心。這次投資延續 Google 在台布局近 20 年的發展,強化台灣在 AI 供應鏈與資料中心架構中的關鍵角色,也讓台美科技合作進入更緊密的新階段。
Thumbnail
所有大咖 CSP 現在都已經進到「大量量產 AI 資料中心」階段,不再只是試水溫,2025–2027 是全球 AI 機房爆發期! 一、全球 AI 資料中心進度: 2025年 IEA 最新報告估計,光 AI 資料中心一年 CapEx 就逼近 5,80
Thumbnail
所有大咖 CSP 現在都已經進到「大量量產 AI 資料中心」階段,不再只是試水溫,2025–2027 是全球 AI 機房爆發期! 一、全球 AI 資料中心進度: 2025年 IEA 最新報告估計,光 AI 資料中心一年 CapEx 就逼近 5,80
Thumbnail
這篇文章幫你快速了解 Google 在德國的最新 AI 基礎建設布局 🚀。讀完後,你會清楚知道:Google 為什麼砸下 55 億歐元打造資料中心、這筆投資如何結合雲端運算與綠能供暖,以及這對歐洲 AI 發展與能源轉型代表什麼意義。
Thumbnail
這篇文章幫你快速了解 Google 在德國的最新 AI 基礎建設布局 🚀。讀完後,你會清楚知道:Google 為什麼砸下 55 億歐元打造資料中心、這筆投資如何結合雲端運算與綠能供暖,以及這對歐洲 AI 發展與能源轉型代表什麼意義。
Thumbnail
Google 擬在澳洲聖誕島建置 AI 資料中心,此舉不僅是雲端投資,更是 AI、國防、主權雲與區域基礎設施的戰略佈局。
Thumbnail
Google 擬在澳洲聖誕島建置 AI 資料中心,此舉不僅是雲端投資,更是 AI、國防、主權雲與區域基礎設施的戰略佈局。
Thumbnail
Google 公布「Project Suncatcher」,計畫把 AI 資料中心搬上太空,用太陽能供電、光學鏈路連結 TPU,2027 年將發射兩顆原型衛星驗證技術。本文帶你看這個構想的背景、時間線、技術挑戰與潛在影響。
Thumbnail
Google 公布「Project Suncatcher」,計畫把 AI 資料中心搬上太空,用太陽能供電、光學鏈路連結 TPU,2027 年將發射兩顆原型衛星驗證技術。本文帶你看這個構想的背景、時間線、技術挑戰與潛在影響。
Thumbnail
Google 近日與美國伊利諾州 Broadwing Energy 簽署購電協議 (PPA),採購新建應用碳捕捉與封存 (CCS) 技術的天然氣發電廠電力。此舉將使 Google 在中西部地區的資料中心能獲得穩定的低碳電力,並有助於推動 CCS 技術的商業化應用與普及。
Thumbnail
Google 近日與美國伊利諾州 Broadwing Energy 簽署購電協議 (PPA),採購新建應用碳捕捉與封存 (CCS) 技術的天然氣發電廠電力。此舉將使 Google 在中西部地區的資料中心能獲得穩定的低碳電力,並有助於推動 CCS 技術的商業化應用與普及。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News