面對快速發展中的AI (19)

2025/09/15 更新2025/09/15 發佈閱讀 10 分鐘

關鍵技術之一：高效能計算系統

高效能計算（High-Performance Computing, HPC）是我長期關注的技術領域，也是當前發展先進AI和大型語言模型（LLM）技術的重要基礎。沒有足夠的算力，根本沒辦法訓練出具備競爭力LLM；想在最短的時間之內訓練出比別人更厲害的模型，如果在算力上落後一大截，那會是一件很難達成的任務。所以這幾年世界級的大公司，為了不落人後，都在搶購高階的GPU，或者自行研發高效能的AI晶片。

以下的左側的圖取自於「經濟學人」，可以看到算力的成長，明顯地在2010年因應深度學習的需求而快速起飛，從原本已經很驚人的「每23.7個月加倍」的摩爾定律，變成了「每6個月加倍」的超高速度，因此從2010年到2024年的14年間，算力成長了2²⁸= 2.7 x 10⁸倍。不過這裡指的是高效能算力的成長幅度，一般個人電腦和手機平板的成長速度還是傳統的摩爾定律，因此普羅大眾恐怕根本感受不到這件事。

我在圖的右側標注了最近幾年比較知名、與大模型訓練有關的高效能計算平台，包括微軟、Google、Meta、x.AI以及OpenAI，都不斷在擴充算力的規模。2021年微軟同時使用四千多顆A100 GPU來訓練當時最大的模型，之後Google也不甘示弱，在2022年發表了用了6千多顆TPU晶片訓練出更大的模型，而Meta不僅建置大規模的算力來訓練Llama系列大模型，還將訓練好的大模型開放供大眾下載使用。如今，這些大公司仍然爭相採購最新最強的GPU，並且建置更大規模的算力平台。例如，OpenAI找了Softbank、Oracle等公司共同投資興建一座名為Stargate的算力中心，宣稱規模要達到40萬顆、甚至上百萬顆GPU。

要知道，一顆高階的GPU的行情大約是100萬元台幣上下，所以10萬顆高階的GPU大概要10萬 x 100萬元 = 1000億台幣，如果接下來的競爭越演越烈，算力中心進入到100萬顆GPU等級的話，那就是1兆台幣的投資，而且這些投資所採購的GPU，可不是房地產或黃金，由於技術不斷在進步，很可能在四年後就沒什麼殘餘價值了。所以說，這些大公司的競爭是極為劇烈的，擁有大量的算力，不僅是為了爭取領先地位，也是為了存活，不得不傾力投入戰局。

實際上，算力、人才、資料可說是訓練大模型的三大要件。即便有充沛的算力，還需要第一流的人才和充足有效的資料。2025年7月SemiAnalysis網站有一篇文章探討Meta如何努力在算力、人才、資料上取得領先地位 [1]，包括在2026年底之前建置完成50萬顆GPU的算力中心，比OpenAI Stargate的40萬顆GPU規模更大，以極高的薪資爭取（挖角）第一流的人才，同時從Llama 4的失敗經驗中學到一些教訓：時至今日這個推理（reasoning）模型掛帥的年代，必須更加重視資料集的品質，不能再盲目或不假思索地蒐集訓練所需的資料。

另一方面，中國以國家的力量發展AI，在十億人口和政策支持的基礎上，能夠以極多的優秀人才和西方國家企業所無法取得的資料來打造大模型。因此，美國幾年前眼見苗頭不對，恐怕中國的AI發展進步太快，於是開始限制高效能晶片輸出至中國。但即便在算力受限的情況下，中國AI大模型的進步仍然讓許多人跌破眼鏡。2025年初以來，包括DeepSeek和Qwen等中國公司出品的模型陸續公開供大眾下載，口碑相當不錯。我看當前的頂尖AI會議論文，有超過一半的作者是華人，人才的重要性實在不容小覷。

因為無法（合乎美國政府的規定）進口最新的高效能晶片，中國只好自立自強，開始自行研製高效能晶片和系統。華為在今年4月發表了AI CloudMatrix 384系統，說是憑藉其顛覆性的系統架構設計與全棧技術創新，在多項關鍵指標上實現對英偉達旗艦産品GB200 NVL72的超越，標誌着中國在人工智慧基礎設施領域實現里程碑式突破。央視網還「引用」SemiAnalysis的評論，說CloudMatrix 384領先英偉達和AMD的産品一代 [2]。

華為CloudMax 384

實際上SemiAnalysis並沒有這麼說，如果讀者細看以下的比較表，可以看到CloudMatrix 384雖然在算力、記憶體容量、記憶體頻寬上領先Nvidia的GB200 NVL72，但因為單晶片的效能不如GB200，只好使用更多的晶片。Nvidia的系統使用了72顆GPU，華為則使用了384顆910C晶片，以5.3倍的晶片數量從4.1倍的耗電量來取得所謂的領先地位。再繼續讀下去之前，讀者不妨從以上CloudMatrix 384的圖片中算算它使用了多少個機櫃？

答案揭曉，CloudMatrix 384使用了16個機櫃。那麼Nvidia GB200 NVL72使用了幾個機櫃呢？答案是1個。以下是我去年在Supercomputing Conference展場中拍攝到Asus製造的GB200 NVL72，1個機櫃塞進72個GPU以及連接GPU的NVSwitch，價格大約一億元台幣，所以有人戲稱「億元櫃」。我不知道華為CloudMatrix 384一套要賣多少錢？要賣多少才能回收研發成本？訓練大模型要負擔比GB200多幾倍的電費？但對中國來說，為了自立自強，錢不是問題。很多人都聽過60年前的中國有一句名言：「寧要核子，不要褲子」，形容當時的中國雖然窮困仍傾全力發展核子武器；如今研發AI的重要性不亞於核子武器，以當前中國的國力，這些研發成本和電力又算得上什麼？

NVIDIA GB200 NVL72

話說回來，看到國外搶購GPU的熱潮、台灣系統廠出貨很開心，但我們國內有多少高效能計算資源可用於發展先進AI技術、尖端的大模型工程呢？坦白說，並不多。有人說，台灣根本用不到高效能計算、資料量不足，或是用國外的雲端資源就行，我想，實際的情況絕非如此，國內的科技和產業要升級的話，必須要在AI領域上具備核心競爭力。如我在之前的論述中提及的，可以利用開放權重的基礎模型（open-weight foundation models），加上領域專家的智慧和推理，訓練出優秀的專家模型，不見得要有巨量資料才行，只是沒有起碼的算力，那就難了。

對我來說，不管有沒有算力，該做的探索還是要做。我這半年來帶著一群學生研究如何提升大模型推論和訓練的效率、如何透過適當的過濾、分類、驗證程序來獲得高品質的推理軌跡（reasoning traces）、以及如何利用演化（evolve）框架讓大模型參考人類的智慧後產生高效能的晶片設計，即便在缺乏大規模算力的情況下，我們仍然能有所收穫。所幸在最近一個月獲得Taipei-1的64顆H100 GPU算力加持下，我們終於能實際驗證想法並且大幅推展實務進度，真是受益良多。尤其是參與研究的學生，從一開始的坐井觀天，只知道一些理論和招式，到後來對大模型和高效能平台的實務有所體會，有機會在將來成為業界冀求的人才，算是他們的造化。

我想引用美國電影Field of Dreams的一句名言“if you build it they will come”，來形容我對於高效能計算和先進研究的看法。片中的農場主人Ray有天聽到神秘聲音說：「你蓋好了，他們就會來。」於是剷平了自己的玉米田建造了一座棒球場，而棒球偶像真的來到這裡打球。國內很少人實際接觸過高效能計算，是因為業界長年重硬體製造、輕忽或不相信軟體研發的價值；今天在AI的浪潮下，高效能計算資源就像片中的棒球場，可以吸引和培育人才，強化核心競爭力，讓他們有辦法乘風破浪。或許有人提供了算力，就像當年的紅葉少棒隊，可以追逐夢想，創造奇蹟。

[1] Dylan Patel, Jeremie Eliahou Ontiveros, Wei Zhou, AJ Kourabi and Maya Barkin (2025-07-11,SemiAnalysis), Meta Superintelligence – Leadership Compute, Talent, and Data. https://semianalysis.com/2025/07/11/meta-superintelligence-leadership-compute-talent-and-data/

[2] 央視網 | 2025-04-18. SemiAnalysis稱：華為雲CloudMatrix 384領先英偉達和AMD的産品一代。https://big5.cctv.com/gate/big5/business.cctv.cn/2025/04/18/ARTIL1uiTGWZipH1prKSUD0t250418.shtml

[3] Dylan Patel, Daniel Nishball, Myron Xie, Patrick Zhou, Ivan Chiam, AJ Kourabi, Christopher Seifel and Doug OLaughlin (2025-04-16,SemiAnalysis). AI CloudMatrix 384 – China’s Answer to Nvidia GB200 NVL72. https://semianalysis.com/2025/04/16/huawei-ai-cloudmatrix-384-chinas-answer-to-nvidia-gb200-nvl72/

留言

留言分享你的想法！

洪士灝的隨筆

67會員

19內容數

隨筆把我的觀察和感想寫出來，透過寫作讓自己腦袋清淨一點、心靈輕爽些。舊文放在https://hungsh-ntucsie.blogspot.com/，文章大多先在臉書上與臉友分享，隨後再轉到這裡臉書網址為：https://www.facebook.com/shihhaohung

洪士灝的隨筆的其他內容

2025/07/14

面對快速發展中的AI (18)

培養研發關鍵核心AI技術的人才：業界的角色

2025/07/14

面對快速發展中的AI (18)

培養研發關鍵核心AI技術的人才：業界的角色

2025/07/09

面對快速發展中的AI (17)

培養研發關鍵核心AI技術的人才：政府的狀況。上回提到，不是凡事得靠政府，這此來談談政府在AI人才培育上做了哪些事情。

2025/07/09

面對快速發展中的AI (17)

培養研發關鍵核心AI技術的人才：政府的狀況。上回提到，不是凡事得靠政府，這此來談談政府在AI人才培育上做了哪些事情。

2025/07/02

面對快速發展中的AI (16)

培養研發關鍵核心AI技術的人才：國內的困境。國內的產官學界對於研發核心AI技術人才的培育做得並不理想，這篇略述問題之所在。

2025/07/02

面對快速發展中的AI (16)

培養研發關鍵核心AI技術的人才：國內的困境。國內的產官學界對於研發核心AI技術人才的培育做得並不理想，這篇略述問題之所在。

看更多

你可能也想看

Emma 的意識界。

輕鬆賺零用金的祕密 | 蝦皮分潤計畫賺零用金實測成果開箱＋近期敗家好物開箱 😁

透過蝦皮分潤計畫，輕鬆賺取零用金！本文分享5-6月實測心得，包含數據流程、實際收入、平臺優點及注意事項，並推薦高分潤商品，教你如何運用空閒時間創造被動收入。

#蝦皮#行動電源#測試

2025/09/07

Emma 的意識界。

輕鬆賺零用金的祕密 | 蝦皮分潤計畫賺零用金實測成果開箱＋近期敗家好物開箱 😁

#蝦皮#行動電源#測試

2025/09/07

好好宅在家

【單身實驗室．蝦皮分潤計畫】藏身蝦皮的植系青屬，為我的北向陽台增添家人。

單身的人有些會養寵物，而我養植物。畢竟寵物離世會傷心，植物沒養好再接再厲就好了~（笑）

#開箱#蝦皮分潤計畫#單身實驗室

2025/09/12

好好宅在家

【單身實驗室．蝦皮分潤計畫】藏身蝦皮的植系青屬，為我的北向陽台增添家人。

單身的人有些會養寵物，而我養植物。畢竟寵物離世會傷心，植物沒養好再接再厲就好了~（笑）

#開箱#蝦皮分潤計畫#單身實驗室

2025/09/12

翰墨飄香的沙龍

補貨小日常｜居家生活用品實測分享，還順便開啟蝦皮分潤計畫小驚喜！

不知你有沒有過這種經驗？衛生紙只剩最後一包、洗衣精倒不出來，或電池突然沒電。這次一次補貨，從電池、衛生紙到洗衣精，還順便分享使用心得。更棒的是，搭配蝦皮分潤計畫，愛用品不僅自己用得安心，分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E，輕鬆上手，隨時隨地賺取分潤！

#衛生紙#洗衣精#居家生活

2025/09/10

翰墨飄香的沙龍

補貨小日常｜居家生活用品實測分享，還順便開啟蝦皮分潤計畫小驚喜！

#衛生紙#洗衣精#居家生活

2025/09/10

阿Mo的murmur小天地🪄

開箱＋分潤分享｜社畜的療癒小樹洞 🧑‍🎨 iPad 殼 × 蝦皮分潤計畫

身為一個典型的社畜，上班時間被會議、進度、KPI 塞得滿滿，下班後只想要找一個能夠安靜喘口氣的小角落。對我來說，畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉，還是慢慢描繪喜歡的插畫人物，那個專注在筆觸和色彩的過程，就像在幫心靈按摩一樣，讓緊繃的神經慢慢鬆開。

#小確幸#iPad#樹洞

2025/09/10

阿Mo的murmur小天地🪄

開箱＋分潤分享｜社畜的療癒小樹洞 🧑‍🎨 iPad 殼 × 蝦皮分潤計畫

#小確幸#iPad#樹洞

2025/09/10

徐倪妍-離職公務員的一人品牌經營學

未來學會這項AI無法替代的稀缺能力人生就輕鬆了

AI高速發展，現今一天的變幻超過古代十年的發展，不少人對未來充滿焦慮、迷茫，但一直以來都有一項能力，不僅人人都能學、還無法被AI取代﹔而貫穿古今，只要精通這能力，人生普遍差不了…

#說話#好好說話#溝通

2024/08/07

徐倪妍-離職公務員的一人品牌經營學

未來學會這項AI無法替代的稀缺能力人生就輕鬆了

#說話#好好說話#溝通

2024/08/07

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

在當今快速變化的數位時代，企業面臨著前所未有的數據處理需求。為了應對這些挑戰，企業紛紛建立自己的大型語言模型（LLM），利用大量數據進行訓練，讓模型能夠理解並生成自然語言，從而實現人機協作，優化業務流程並提升客戶體驗。

#廣告雜誌#專欄#cacaFly

2024/07/31

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

#廣告雜誌#專欄#cacaFly

2024/07/31

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

熙哥生意之道

人工智能AI和機器學習ML：業務升級的新動能

在當今快速發展的技術時代，人工智能 Artificial Intelligence 和機器學習 Machine Learning 已成為推動業務創新和增長的重要力量。從改善客戶服務到優化運營流程，AI和ML的應用範圍日益廣泛，為企業創造出前所未有的機會。企業又可如何利用AI和ML提升業務呢？

#AI#ML#人工智能

2024/07/26

熙哥生意之道

人工智能AI和機器學習ML：業務升級的新動能

#AI#ML#人工智能

2024/07/26

莎姐的矽谷茶棧

你開始使用AI了嗎？

最新的AI趨勢讓人眼花撩亂，不知要如何開始學習？本文介紹了作者對AI的使用和體驗，以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具，可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心，不停止學習，並提出了對健康生活和開心生活的祝福。

2024/06/14

2024/06/14

迎戰未來，AI 量子計算基礎篇 (1)，Single Systems

預計量子AI計算會在2032年左右來到，在這之前，我們還有充足的時間可以逐步去學習量子計算與演算法，讓我們按部就班，持續前進，做輕鬆無負擔的超前學習 !

#QuantumComputing#Qiskit#braket

2024/06/13

無限智慧學院的沙龍

迎戰未來，AI 量子計算基礎篇 (1)，Single Systems

#QuantumComputing#Qiskit#braket

2024/06/13

廣告雜誌

黃仁勳風暴(一)：生成式AI強大潛能！AWS與NVIDIA Project Ceiba超級AI運算平台加速創新

在科技發展的浪潮中，生成式AI無疑是引領未來的關鍵力量。透過深度學習技術，AI系統能夠從大量資料中發掘規律，並創造出全新的內容，無論是文字、圖像、音頻還是視頻，都可以在AI的加持下重新定義。

#黃仁勳#AWS#NVIDIA

2024/06/06

廣告雜誌

黃仁勳風暴(一)：生成式AI強大潛能！AWS與NVIDIA Project Ceiba超級AI運算平台加速創新

#黃仁勳#AWS#NVIDIA

2024/06/06

期貨選擇權交易紀錄心得交流

NVIDIA 黃仁勳 - AI演講即時摘要_元大證券

NVIDIA 黃仁勳 - AI人工智慧時代如何帶動全球新產業革命（個人紀錄用） 🇺🇸Omniverse 就是未來集大成，而加速運算、人工智慧就是兩個最重要的技術核心 🇺🇸CPU效能的擴充速度正在大幅降低，提出「運算通膨」概念

#NVIDIA#AI人工智慧#革命

2024/06/03

期貨選擇權交易紀錄心得交流

NVIDIA 黃仁勳 - AI演講即時摘要_元大證券

#NVIDIA#AI人工智慧#革命

2024/06/03

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News