筆記-24.03.25-科技財知道
*輝達想做的事情非常多,包括AI GPU的算力提供(GB200)、協助半導體製造(cuLitho)、車用晶片(Drive Thor)、機器人開發平台(GR00T)、元宇宙等物理模擬(Omniverse)。
*GB200 = 2個B100+1個Grace CPU。
-GH200 = 1個H100+1個Grace CPU。
*36個GB200 = GB200 NVL72(共有72顆GPU、實際上有144顆B100)。
-32個GH200 = GH200 DGX(共有32顆H100)。
*DGX B200,為8顆B200,每個B200 是由2個B100組成
-DGX H100,為8顆H100
*GB200,一個伺服器機櫃 共有144顆B100
-GH200,一個伺服器機櫃 共有32顆H100,
GB200在GPU數量上提升4.5倍,加上每一個B100的效率比H100多30%,整體效能大約提升5倍。
*Blackwell Transformer Engine,實現FP4(4位元浮點)的AI訓練或推論,讓模型的效能加倍,同時保持高精確性。
*之前AI運算比較常看到的是FP8,可以降低精度、來加快運算速度。
精度不同,位數不同。
數字由 整數位 與 小數位(尾數位)組成。
FP16 小數位比較多
BF16 整數位比較多,看訓練場景需要用哪一種。
--FP8 位數更小,雖然精度比較低、但還OK,用比較低的精度,來加速訓練速度。
*AMD MI300X,在AI訓練上,比不贏GB200。
AMD在AI伺服器方面 比不贏輝達。
*AMD MI300X的優勢: 不在AI運算,而在HPC效能。
國家級實驗室,做氣象預測,需要高精度,FP 64的表現上比H100好。AMD較便宜,也有CP值較佳的優勢。
--超級電腦,除了AI運算之外,還要HPC。
*cuLitho,加速晶片製造的函式庫,
可以讓台積電加速光罩的修正速度,
會變成光罩製造流程的重要一環。
--台積電 輝達 新思,一起合作 關係緊密。
*目前主流的車用晶片: 1.MCU控制晶片
2.智能駕駛座艙晶片(智駕座艙晶片),
車裡的電子元件持續增加,娛樂螢幕、抬頭顯示器、廣播收音機、中控顯示螢幕、後座顯示器,都需要算力提供,把這些晶片整合在同一個晶片 = 智駕座艙晶片。
--智駕座艙晶片 的主流晶片,
新興車企 螢幕多,主流晶片: 高通8155/8295、驍龍6系/8系
傳統車企 螢幕少,主流晶片: NXP/TI/瑞薩(御三家)。
3.自動駕駛晶片,
高階自動駕駛,主流晶片: Nvidia Orin、高通Ride、華為MDC系列
中低階自動駕駛(L1-L2),主流晶片: Mobileye EyeQ4、地平線征程J3
*有些新興車企 是用高通8155/8295 (智駕座艙晶片) + Nvidia Orin(自動駕駛晶片)。
--輝達推出了Drive Thor晶片,要把這兩個晶片 合成一個晶片。用在吉利汽車、比亞迪。
--對於高通的打擊大,因為比亞迪是高通的智駕座艙晶片大客戶,
高通的Ride Flex也是把智駕晶片+ 自動駕駛晶片做結合。
之後輝達 與高通在車用晶片上終須一戰。
*通用機器人: 輝達要提供機器人廠商一整包的服務,有機器人晶片Jetson Thor、機器人模擬平台Isaac、機器人基礎模型GR00T。
--輝達之前就有Isaac機器人模擬平台(基於Omniverse平台,Omniverse的物理引擎可以模擬出真實世界的物理場景),模擬機器人走路等動作,類似半導體的EDA工具。
--輝達GR00T,是個基礎模型,可以通用於各家機器人廠商。
--有些機器人廠商的專業在手臂、動力系統,在沒有AI相關或基礎語言模型的優勢。
--Jetson Thor,為給機器人用的晶片,提供GPU算力。
*特斯拉要自產自銷機器人產品,輝達要做的是開發機器人的平台與工具。
*輝達把Omniverse導入apple Vision Pro裡面,在AR VR MR上面的模擬應用。