即時精選

NVDA黃仁勳於DDN訪談重點分享:後訓練與Reasoning推理所需算力比我們想像更大

更新於 發佈於 閱讀時間約 4 分鐘
投資理財內容聲明

老黃:大家誤會AI只有預訓練跟推理,覺得DS的出現減少了推理的成本,但大家忘了有後訓練這一階段,甚至比預訓練更吃算力


這段訪談的含金量超過太多次法說會上的數字,能夠免費聽到DDN邀請老黃訪談的這些內容很賺。附上連結,有興趣的可以參考,老黃是從44分開始訪談

https://www.youtube.com/live/F3NJ5TwTaTI?si=B3DY_sNRBE-PN5wU

我統整了三大重點分享給大家


重點一:後訓練(Post-Training)所需的算力甚至比預訓練更大

*市場誤會LLM只有預訓練(Pre-Training)+ 推理(Inference),其實LLM是預訓練+後訓練(Post-Training)+推理(Reasoning)。大家對預訓練都很熟悉了,就是把數據導入模型開始上課讀書,但後訓練是各領域將專業知識(醫療、法律等)導入模型做商業化的訓練,也就是上課完了回家寫題庫解題,假設沒有後訓練這個動作,就沒有商業價值,有了價值之後才可以用這個能力出門上班賺錢(推理)。

*為什麼後訓練所需的算力甚至比預訓練更大?後訓練的幾個主要工作包括 SFT(用人類標註資料微調)、RLHF(強化學習+人類回饋)、Self-Refine(AI幫自己糾錯),這些動作是要來回N遍試錯,每個過程都是算力密集型的工作,沒有強大的算力。另外預訓練是一次性的訓練,後訓練是會日益增加,企業一直灌新思維進去一直調,可以是無止盡的。(而訪談中的算力需求,我認為講的是未來所需的總量,而非在此刻所需的量)


重點二:現在AI要的推理不是Inference而是更高階的Reasoning推理,算力需求會比過去更高

*市場認為 AI 已經訓練完了,未來的計算需求會大幅下降,而隨著 AI 開始進行更高階的推理(Reasoning)與決策,Reasoning AI的最終目的不只要像人類一樣理解世界還要超越人類現有頭腦的思維,推理越多答案質量越高,所以算力需求會比過去更高

*Inference和Reasoning兩種推理差別在哪裡?Inference就是模型教他什麼,他就被定型為什麼,不會學習新東西,只有標準答案,而Reasoning是會從跟人類與其他AI互動中去學新東西開始拆解問題,自己發現新的規律創造新知識,不斷產生新的假設來檢查結果。像是Reasoning AI 在醫學領域可以超越人類現有邏輯推出新的治療方法,而不只是比對既有病例去推論該如何治療。或是一般Level2的自駕系統偏向inference依賴原先設定好的地圖跟感測器做反應,如果前方有障礙物,車子就停下來,而TSLA的FSD就是Reasoning,前方有障礙物他就會像人類一樣繞道


重點三:市場忽略了代理AI+數位孿生的重要性,未來所有公司都將走入數位世界

*AI就是要產生商業價值,而AI代理相當重要,過去我們對於公司的數據有很多疑問(我白話的翻譯就是我們沒get到數據代表的含義),或是我們想像力就是不足,但AI代理會去進行數據交叉查局、生出有意義的報告來幫助企業的獲利,還省時間

*當AI代理跟數位孿生結合的時候,就能夠實現極巨突破性的事情,訪談中的舉例:在現實世界中研發某種治療疾病的藥物,成本極高,可能需要數十億美元、數年時間,還要通過 FDA審核,最後可能還是不成功。如果有 10 種不同的研究方向,無法依序或同時進行所有實驗,這時候就可以在數位孿生中建立數位分身(Digital Twins),同時去模擬這些研究方向,在虛擬環境中測試並找到最佳解決方案,從而大幅加速創新過程並降低成本

*原文:所有公司最終都會希望能夠在數位世界中運作,因為在數位世界中,一切的運行速度都更快。而 Omniverse 的概念,就是讓每家公司都能擁有自己的 數位分身(Digital Twin),這個想法非常深遠且具有革命性。然而,我不確定所有人都真正理解它的重要性。這正是我們目前的發展旅程:我們從超級運算(Supercomputing)進入企業應用(Enterprise),現在則是從企業應用邁向企業的數位分身(Digital Twin of Enterprise)

*因為目前市面上最成熟的AI代理+數位孿生大概就是PLTR,所以聽到這一段感覺就是PLTR的代名詞,等市場冷卻後我會寫PLTR的深度講解。而數位孿生最受惠的也是NVDA,他早已準備好Omniverse平台跟滿滿算力


總結來說,目前還沒看到GPU需求遞減的跡象,AI能變的花樣超越我們想像力,當然在資本市場大家還是看增速跟評價,不過以目前評20幾倍來看,不管禮拜四的財報如何,他都是一個中長期的送分題

NVDA 1year forward PE(by BBG)

NVDA 1year forward PE(by BBG)


你不知道這杯熱水何時會涼,但你知道他一定會涼。

2025.02.24 宋分


avatar-img
10會員
2內容數
以金融機構角度分析美股,用商業模式、核心競爭力、產業現況找出被低估的金雞母
留言
avatar-img
留言分享你的想法!

































































本篇參與的主題活動
當流量至上成為標準,性騷擾被輕描淡寫、受害者被噤聲,我們是否還能給孩子一個安全的未來?作為父親,我無法接受這種價值觀繼續影響下一代。我們該做的,不是遺忘,而是改變環境——拒絕縱容、用行動發聲,讓孩子知道「尊重是底線,說不是權利」。這不只是關於孫生,而是關於我們願意為未來的孩子守住什麼樣的世界。
學習《小狗錢錢》的理財方法,並透過實際操作,達成財務目標與自我提升。從記帳、設定目標、寫夢想清單、成功日記,到發展副業,分享如何將書中方法應用於生活中,並體會到理財不僅僅是管理金錢,更是規劃生活,實現夢想的重要過程。
比較2017年與2024年日本東北旅遊照片,對比藏王樹冰、銀山溫泉、山寺等景點在不同時間的景觀差異,即使地點相同,不同時間的體驗與感受截然不同,珍惜每個當下的珍貴回憶。2024年因暖冬導致雪景不如預期,反觀2017年的雪景壯觀美麗。新聞報導2025年日本東北暴雪,衷心祈願一切平安。
經過年末年初的大掃除,大家是否也好好整頓了自己的居家環境呢?身為家有幼童的媽媽,我也是歷經多次的練習,才調整到適合自己的清潔節奏,在此與大家分享我的清潔小撇步,每個習慣幾乎不超過5分鐘,就能換得一室乾淨,一起來看吧!
記錄一場前往屏東縣三地門鄉德文山(觀望山)的登山之旅,分享路線規劃、登山心得、沿途風景與美食體驗,並提醒登山客注意入山證申請及避免錯過三角點。
薪水的高低,從來不是努力的問題,而是思維的選擇。年薪百萬的人,不是單靠埋頭苦幹,而是透過「創造價值」決定自己的價格。他們懂得提升不可取代性、創造多重收入、主動尋找機會、投資自己,讓財富加速成長。與其等加薪,不如掌握「決定薪資的能力」。這篇文章,讓你看清真正的收入差距,從現在開始,為自己創造更高價值!
當流量至上成為標準,性騷擾被輕描淡寫、受害者被噤聲,我們是否還能給孩子一個安全的未來?作為父親,我無法接受這種價值觀繼續影響下一代。我們該做的,不是遺忘,而是改變環境——拒絕縱容、用行動發聲,讓孩子知道「尊重是底線,說不是權利」。這不只是關於孫生,而是關於我們願意為未來的孩子守住什麼樣的世界。
學習《小狗錢錢》的理財方法,並透過實際操作,達成財務目標與自我提升。從記帳、設定目標、寫夢想清單、成功日記,到發展副業,分享如何將書中方法應用於生活中,並體會到理財不僅僅是管理金錢,更是規劃生活,實現夢想的重要過程。
比較2017年與2024年日本東北旅遊照片,對比藏王樹冰、銀山溫泉、山寺等景點在不同時間的景觀差異,即使地點相同,不同時間的體驗與感受截然不同,珍惜每個當下的珍貴回憶。2024年因暖冬導致雪景不如預期,反觀2017年的雪景壯觀美麗。新聞報導2025年日本東北暴雪,衷心祈願一切平安。
經過年末年初的大掃除,大家是否也好好整頓了自己的居家環境呢?身為家有幼童的媽媽,我也是歷經多次的練習,才調整到適合自己的清潔節奏,在此與大家分享我的清潔小撇步,每個習慣幾乎不超過5分鐘,就能換得一室乾淨,一起來看吧!
記錄一場前往屏東縣三地門鄉德文山(觀望山)的登山之旅,分享路線規劃、登山心得、沿途風景與美食體驗,並提醒登山客注意入山證申請及避免錯過三角點。
薪水的高低,從來不是努力的問題,而是思維的選擇。年薪百萬的人,不是單靠埋頭苦幹,而是透過「創造價值」決定自己的價格。他們懂得提升不可取代性、創造多重收入、主動尋找機會、投資自己,讓財富加速成長。與其等加薪,不如掌握「決定薪資的能力」。這篇文章,讓你看清真正的收入差距,從現在開始,為自己創造更高價值!
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
本文討論了在AI時代下我們需要具備的職能,例如提問力、判斷力和專業能力。同時也提到了在使用AI時需要注意的事情,以及一些問答希望可以跟讀者有所互動與交流。另外作者也分享了自己使用AI工具的心得,並期待可以幫助初學者更快地瞭解如何應對AI的基礎邏輯。
Thumbnail
使用AI所產出的資訊,必須審慎判讀取捨,不宜照單全收。
Thumbnail
如果可以使用生成式AI結合其他技術以模擬學校、課堂,並在此基礎上分析學生四大學習要素。這可以幫助老師事先知道何種學習設計對學生最適合,並避免因試誤造成的不良影響。不要澆熄學生的學習熱情,可以與ChatGTP協作快速產出多個版本的學習設計,並將其套用到班級學習模擬情境模擬器,以獲得早期教學反饋的機會點
未來會取代你工作的不是AI,而是比你會用AI的人。 我喜歡透過交流聊天來驗證腦中的想法,這是在港大養成的習慣,但到了職場上,卻往往成為別人攻擊批評的藉口,說我「說多做少」,然而實際上工作這麼多年完成將近50個專案好像也夠負責任了⋯ 我一直不是個動手能力強的人,但我很愛思考(幻想),把邏輯流程
我們知道AI的作法可以分為Supervised Learning、Unsupervised Learning、Reinforcement Learning,整題區分如下圖: 圖片出處:https://www.superannotate.com/blog/supervised-learning-an
這個頻道將提供以下服務: 深入介紹各種Machine Learning技術 深入介紹各種Deep Learning技術 深入介紹各種Reinforcement Learning技術 深入介紹Probabilistic Graphical Model技術 不定時提供讀書筆記 讓我們一起在未
Thumbnail
一篇闡述未來 AI 發展及對人類的影響力的文章,內容包括 AI 的發展趨勢、NVIDIA 未來目標、地緣政治等議題,透過分析提供投資信心。
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
本文討論了在AI時代下我們需要具備的職能,例如提問力、判斷力和專業能力。同時也提到了在使用AI時需要注意的事情,以及一些問答希望可以跟讀者有所互動與交流。另外作者也分享了自己使用AI工具的心得,並期待可以幫助初學者更快地瞭解如何應對AI的基礎邏輯。
Thumbnail
使用AI所產出的資訊,必須審慎判讀取捨,不宜照單全收。
Thumbnail
如果可以使用生成式AI結合其他技術以模擬學校、課堂,並在此基礎上分析學生四大學習要素。這可以幫助老師事先知道何種學習設計對學生最適合,並避免因試誤造成的不良影響。不要澆熄學生的學習熱情,可以與ChatGTP協作快速產出多個版本的學習設計,並將其套用到班級學習模擬情境模擬器,以獲得早期教學反饋的機會點
未來會取代你工作的不是AI,而是比你會用AI的人。 我喜歡透過交流聊天來驗證腦中的想法,這是在港大養成的習慣,但到了職場上,卻往往成為別人攻擊批評的藉口,說我「說多做少」,然而實際上工作這麼多年完成將近50個專案好像也夠負責任了⋯ 我一直不是個動手能力強的人,但我很愛思考(幻想),把邏輯流程
我們知道AI的作法可以分為Supervised Learning、Unsupervised Learning、Reinforcement Learning,整題區分如下圖: 圖片出處:https://www.superannotate.com/blog/supervised-learning-an
這個頻道將提供以下服務: 深入介紹各種Machine Learning技術 深入介紹各種Deep Learning技術 深入介紹各種Reinforcement Learning技術 深入介紹Probabilistic Graphical Model技術 不定時提供讀書筆記 讓我們一起在未
Thumbnail
一篇闡述未來 AI 發展及對人類的影響力的文章,內容包括 AI 的發展趨勢、NVIDIA 未來目標、地緣政治等議題,透過分析提供投資信心。
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法