NVDA黃仁勳於DDN訪談重點分享：後訓練與Reasoning推理所需算力比我們想像更大

宋分

更新於 2025/02/24發佈於 2025/02/24閱讀時間約 4 分鐘

投資理財內容聲明

老黃：大家誤會AI只有預訓練跟推理，覺得DS的出現減少了推理的成本，但大家忘了有後訓練這一階段，甚至比預訓練更吃算力

這段訪談的含金量超過太多次法說會上的數字，能夠免費聽到DDN邀請老黃訪談的這些內容很賺。附上連結，有興趣的可以參考，老黃是從44分開始訪談

https://www.youtube.com/live/F3NJ5TwTaTI?si=B3DY_sNRBE-PN5wU

我統整了三大重點分享給大家

重點一：後訓練(Post-Training)所需的算力甚至比預訓練更大

*市場誤會LLM只有預訓練（Pre-Training）+ 推理（Inference），其實LLM是預訓練+後訓練(Post-Training)+推理(Reasoning)。大家對預訓練都很熟悉了，就是把數據導入模型開始上課讀書，但後訓練是各領域將專業知識(醫療、法律等)導入模型做商業化的訓練，也就是上課完了回家寫題庫解題，假設沒有後訓練這個動作，就沒有商業價值，有了價值之後才可以用這個能力出門上班賺錢(推理)。

*為什麼後訓練所需的算力甚至比預訓練更大？後訓練的幾個主要工作包括 SFT(用人類標註資料微調）、RLHF（強化學習+人類回饋)、Self-Refine(AI幫自己糾錯)，這些動作是要來回N遍試錯，每個過程都是算力密集型的工作，沒有強大的算力。另外預訓練是一次性的訓練，後訓練是會日益增加，企業一直灌新思維進去一直調，可以是無止盡的。(而訪談中的算力需求，我認為講的是未來所需的總量，而非在此刻所需的量)

重點二：現在AI要的推理不是Inference而是更高階的Reasoning推理，算力需求會比過去更高

*市場認為 AI 已經訓練完了，未來的計算需求會大幅下降，而隨著 AI 開始進行更高階的推理(Reasoning)與決策，Reasoning AI的最終目的不只要像人類一樣理解世界還要超越人類現有頭腦的思維，推理越多答案質量越高，所以算力需求會比過去更高

*Inference和Reasoning兩種推理差別在哪裡？Inference就是模型教他什麼，他就被定型為什麼，不會學習新東西，只有標準答案，而Reasoning是會從跟人類與其他AI互動中去學新東西開始拆解問題，自己發現新的規律創造新知識，不斷產生新的假設來檢查結果。像是Reasoning AI 在醫學領域可以超越人類現有邏輯推出新的治療方法，而不只是比對既有病例去推論該如何治療。或是一般Level2的自駕系統偏向inference依賴原先設定好的地圖跟感測器做反應，如果前方有障礙物，車子就停下來，而TSLA的FSD就是Reasoning，前方有障礙物他就會像人類一樣繞道

重點三：市場忽略了代理AI+數位孿生的重要性，未來所有公司都將走入數位世界

*AI就是要產生商業價值，而AI代理相當重要，過去我們對於公司的數據有很多疑問(我白話的翻譯就是我們沒get到數據代表的含義)，或是我們想像力就是不足，但AI代理會去進行數據交叉查局、生出有意義的報告來幫助企業的獲利，還省時間

*當AI代理跟數位孿生結合的時候，就能夠實現極巨突破性的事情，訪談中的舉例：在現實世界中研發某種治療疾病的藥物，成本極高，可能需要數十億美元、數年時間，還要通過 FDA審核，最後可能還是不成功。如果有 10 種不同的研究方向，無法依序或同時進行所有實驗，這時候就可以在數位孿生中建立數位分身（Digital Twins），同時去模擬這些研究方向，在虛擬環境中測試並找到最佳解決方案，從而大幅加速創新過程並降低成本

*原文：所有公司最終都會希望能夠在數位世界中運作，因為在數位世界中，一切的運行速度都更快。而 Omniverse 的概念，就是讓每家公司都能擁有自己的數位分身（Digital Twin），這個想法非常深遠且具有革命性。然而，我不確定所有人都真正理解它的重要性。這正是我們目前的發展旅程：我們從超級運算（Supercomputing）進入企業應用（Enterprise），現在則是從企業應用邁向企業的數位分身（Digital Twin of Enterprise）

*因為目前市面上最成熟的AI代理+數位孿生大概就是PLTR，所以聽到這一段感覺就是PLTR的代名詞，等市場冷卻後我會寫PLTR的深度講解。而數位孿生最受惠的也是NVDA，他早已準備好Omniverse平台跟滿滿算力

總結來說，目前還沒看到GPU需求遞減的跡象，AI能變的花樣超越我們想像力，當然在資本市場大家還是看增速跟評價，不過以目前評20幾倍來看，不管禮拜四的財報如何，他都是一個中長期的送分題

NVDA 1year forward PE(by BBG)

你不知道這杯熱水何時會涼，但你知道他一定會涼。

2025.02.24 宋分

留言

留言分享你的想法！

美股送分題

39會員

14內容數

以金融機構角度分析美股，用商業模式、核心競爭力、產業現況找出被低估的金雞母

美股送分題的其他內容

2025/04/29

TSLA價格卷不過中國的，而FSD並不完全像iPhone的IOS一樣容易能夠建立生態系之後再回來刺激硬體銷量(細節寫在文章裡)，但我也不認為TSLA會完全失去中國，如果中國這塊餅停滯不前，反而公司可能會從其他在監管較低還有跟美國比較友好方面的國家先下手去用FSD生態佈局市佔率，打開更多空間

2025/04/29

2025/03/28

分享AMD出席大摩TMT會議重點摘要，各業務都有正向進展

昨天被降評原因依然是AMD無法沾上NVDA的邊，實在太老梗了先前寫了太多篇AMD重申他在這個階段的賣點並非跟NV比，而是在於他自己的營收比重變化跟獲利能力的提升

2025/03/28

分享AMD出席大摩TMT會議重點摘要，各業務都有正向進展

2025/03/26

分享CRWD管理層交流後看法｜CRWD溢價同業的估值是否還有足夠的數字來支撐？

端點業務是否有遇到飽和的天花板情況？未來該如何從最大競爭對手MSFT或S搶市佔？這幾年公司是刻意著重在upsell現有客戶先穩好模組化的策略，還是單純在新客戶的拓展上遇到貧頸？

2025/03/26

分享CRWD管理層交流後看法｜CRWD溢價同業的估值是否還有足夠的數字來支撐？

#方格新手的其他內容

第一次賺到創業收入的時候，我居然拿去買了「這個東西...」

小🐷的世界沙龍

小學生的真實感受：不敢告訴父母的真心話

Mandy's Way

瑞士一日遊｜萊茵瀑布、Smilestones 微縮世界、蘇黎世散步攻略心得

你可能也想看

普普文創

【文創漫談】數據分析與解讀 | 如何利用AI | 增強能力

數據分析與解讀隨著數據的爆炸式增長，能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術，如統計學、數據挖掘、機器學習等。然而，僅靠短時間的數據分析並不足以提供深入見解。要熟悉數據分析工具和技術，如統計學、數據挖掘和機器學習，可以從以下幾個方面入手：基礎知識的學習

#文創漫談#數據分析與解讀#如何利用AI增強能力

2024/07/28

普普文創

【文創漫談】數據分析與解讀 | 如何利用AI | 增強能力

#文創漫談#數據分析與解讀#如何利用AI增強能力

2024/07/28

腦幽思潮

商機：優化演算法並開始交辦給人工智慧：關於飲食。

反省就是重寫自己的演算法吧？假設我就是人工智慧，或心智的可以被看作爲人工智慧的編輯器，那我的程式碼是什麼樣的？從懵懂無知到一無所知，從自以為是到自我消逝，心智只是執行它的內容，我也需要不斷優化。最好的優化就是簡化。最能創造財富的演算法就是關於如何除錯與減少任何風險。

#人工智慧#演算法#料理

2024/07/27

腦幽思潮

商機：優化演算法並開始交辦給人工智慧：關於飲食。

#人工智慧#演算法#料理

2024/07/27

你的職涯陪伴者葉紹平(平哥)

AI時代下我們需要具備的職能有哪些

本文討論了在AI時代下我們需要具備的職能，例如提問力、判斷力和專業能力。同時也提到了在使用AI時需要注意的事情，以及一些問答希望可以跟讀者有所互動與交流。另外作者也分享了自己使用AI工具的心得，並期待可以幫助初學者更快地瞭解如何應對AI的基礎邏輯。

#初學者AI指南#AI時代職能#AI工具使用

2024/07/26

你的職涯陪伴者葉紹平(平哥)

AI時代下我們需要具備的職能有哪些

#初學者AI指南#AI時代職能#AI工具使用

2024/07/26

從數學謎題衍生對AI科技的想法。

2024/06/20

從數學謎題衍生對AI科技的想法。

2024/06/20

使用AI所產出的資訊，必須審慎判讀取捨，不宜照單全收。

#AI#生成式AI

2024/06/19

度樸的沙龍

慎用AI所產資訊

使用AI所產出的資訊，必須審慎判讀取捨，不宜照單全收。

2024/06/19

2024/06/09

2024/06/09

如果有 AI 孿生教室【未來教育想像】黃仁勳演講的啟發

如果可以使用生成式AI結合其他技術以模擬學校、課堂，並在此基礎上分析學生四大學習要素。這可以幫助老師事先知道何種學習設計對學生最適合，並避免因試誤造成的不良影響。不要澆熄學生的學習熱情，可以與ChatGTP協作快速產出多個版本的學習設計，並將其套用到班級學習模擬情境模擬器，以獲得早期教學反饋的機會點

#生成式AI#教育#未來教育

2024/06/07