我們家分析師大人他去SMCI時有問工程師, 工程師回答的思考邏輯大致是這樣:
舉例來說:假設這世界上你沒有浸沒式液冷這個選項, 氣冷散熱跟水冷相比的優缺點是什麼?
氣冷:價格便宜, 成本較低, 裝載及維修方便, 環保, 不需要太多認證...
但缺點就是最大那個:散熱較差, 造成熱高溫下, 運算效率變慢
但後來大家還是選水冷散熱, 至少目前已逐漸進入到水冷的時代, 但你也許會想那是GB200的TDP比H100多很多....
所以這裡多加幾個考慮的因子要一起考量, 散熱是最重的因子, 因為後面牽涉到運算效率的問題, 但同樣的還有考慮是總成本, 也就是我需要多少的花同樣的散熱設備但哪一個效率可以更好...當然還有環保等因素考量
如果夏天電風扇可就以讓你降溫, 為什麼人類要多花錢裝冷氣?然後裝了冷氣, 之後還要有變頻式冷氣?因為冷氣比電風扇貴, 變頻式冷氣又比非變頻冷氣貴?為什麼大家現在都裝變頻的?
答案應該很容易, 因為人類思考的就是總成本的考量, 不是單一價格的考量
(其實投資理財很多都套用, 包括你買一台EV, 你的總支出考量勝過單一車價...很多例子)
OK, 回到問題討論上:
R系列單一晶片的TDP比GB系列散熱假設降低25%(資料來源是Call詢問的, 目前沒有官方正式數據, 也沒有leak news測試數據, 因為預計2025年Q4進入量產), 但還是將近1000TDP(有非官方數據透露), 因此考慮的有幾的變數:
氣冷的主要零組件: 散熱片, 風扇, 散熱膏, 風道, 機箱, 控制器.
水冷主要組件:冷頭, 水泵, 散熱排, 風扇, 冷卻液, 管路, 儲液罐, 接頭和夾具
浸沒式主要組件:浸沒槽, 冷卻液, 循環泵, 熱交換器, 過濾系統, 控制單元 , 管路和接頭, 密封和保護裝置
氣冷主要成本:散熱片、風扇、散熱膏、機箱。
水冷主要成本:冷頭、水泵、散熱排、風扇、冷卻液、管路、儲液罐、接頭。
浸沒式主要成本:浸沒槽、冷卻液、循環泵、熱交換器、過濾系統、控制單元、管路和接頭、密封裝置。
大人的模型推估出來的(我沒有完整看過他的模型, 這是他告訴我的數據):
氣冷:總成本約 $670/rack。
水冷:總成本約 $1950/rack。
浸沒式:總成本約 $7700/rack。
邊際成本遞減, 用越多越划算的概念(跟老黃講的一樣, 這也是科技推動的長期邊際成本逐漸降低的效應)
浸沒式能均勻冷卻所有電子元件,減少熱應力對設備的損害,從而延長硬體的使用壽命,浸沒式冷卻環境能保護設備免受灰塵和濕氣的影響提高使用年限 。
浸沒式降低了能源和水資源的使用,它能幫助數據中心符合越來越嚴格的環保法規和標準(尤其對環境保護非常機車的歐洲各國),美國能源部和歐盟最近提出更嚴格的HVAC標準,要求數據中心進行成本效益分析並捕捉並利用多餘熱量 。
簡單講就是浸沒式的高效能和低運營成本可以顯著降低數據中心的總成本,並提高其競爭力和環境友好度。
雖然浸沒式液冷系統的初期建設成本較高,但從長期來看,包括總成本、運算效率和環境效益等...一堆的考量,理論上浸沒式液冷系統較其他散熱方式更經濟和可持續的方案,但不是所有都要選擇浸沒式解決方案, 還是要考慮有沒有必要?小公司不會一間小小的機房就用到浸沒式, 需要工程師去計算一堆數據, 找出解決方案, 美股有很多這種解決的工程公司.