週末把黃仁勳在今年GTC 2025大會上的演講看完了,在GTC2025的那幾天,新聞常常在報演講的內容摘要等等訊息。新聞的角度大多是以投資人角度、經濟/政治布局等方面來看整體的走向,商場的事情我不太懂,但我蠻喜歡幾個在演講中提到的技術點。
GTC March 2025 Keynote with NVIDIA CEO Jensen Huang
2025的關鍵詞:代理人AI
在演講開頭的時候,就揭示了一張AI發展的圖表,從「Perception AI」、「Generative AI」、「Agentic AI」到「Physical AI」,而關於Physical AI的部分,則是串接到機器人產業方面。關於這個進程我也很同意,當我們把Generative AI拼拼湊湊之後,開始出現了不少具有「代理人」特性的AI,可以讓AI進行更多需要推論以及創造力的事情。而人類也不會滿足於只讓AI存在於虛擬的世界中,若是能夠把AI導入到實體的機器人內,不論是工業用機器人,還是面向廣大消費者的機器人,都能讓機器人提升更多不同面向的功能。
從代理人AI到機器人AI
以機器人為例,目前已經能在日常生活中看到越來越多的機器人,不過六七年前我開始接觸機器人議題,尤其是能夠提供服務以及與人類互動社交的機器人,機器人技術涵蓋各種感應sensor,而除了能讓它感覺、移動之外,與人類社交的機器人往往還需要語言能力。
受到技術的限制,也影響了機器人的外觀展現,過往機器人不論是實體的或者是用螢幕的方式呈現臉的樣子,但通常只有眼睛,沒有嘴巴,許多會接觸到人類的機器人沒有手腳,只能以滑輪移動。這樣的外型設計也是暗示著機器人仍然不具備足夠的語言能力和手腳並用能力。
而我想,在擁有了強大的大語言模型(Large Langauge Models)技術之後,未來需要與人類社交互動的機器人在外型的設計上可能也會漸漸地開始活化它的嘴巴的功能。黃仁勳在keynote 演講中展示的DEMO機器人也還是沒有嘴巴的形象,比較傾向於寵物的感覺,對人類而言,看到這樣機器人,我想第一反應也都會覺得它非常的「adorable」,非常可愛又靈活聰明。不過,若是希望機器人能進一步的與人類協同工作,我想適當的語言能力也還是必須的。
我感覺機器人的發展還在醞釀能量當中,期待未來看到更多不同的科技發展。
AI的三大議題
另一方面,演講中黃仁勳CEO點了三個AI的重大議題:
- 如何解決資料(data)的問題
- 如何解決訓練的問題
- 如何規模化
AI的本質在於解決資料的問題,AI來自於data,以大語言模型來說,它是收集了好幾兆的token之後,才有能力預測下「1」個token。在我們人類的大腦裡面,也是以這樣快速的運作模式,以我們每個個體過去所有的經驗,搭配環境當中接收到的刺激與資訊,才能讓我們一字接著一字的說出、表達出接下來想要表達的事情。而我們人類在進行思考的時候,未嘗也不是使用「token」在思考呢?語言和思考之間的關係是息息相關的,我們必須仰賴語言來思考,所以當強大的語言模型出現時,某種程度上而言也是表示了電腦已經具備了某種程度的思考能力。
而訓練的問題,就在於我們想要讓AI學習的速度可以像「超人」一樣。培養一個人,十年樹木百年樹人,要培養一個人的思考能力、邏輯推理能力,是非常需要時間的,而人類的頭腦的運算速度又相當的快,所以當我們想要讓電腦能夠以超人般的速度來學習時,非常非常需要成本。
記得我以前看過一篇文章,若我們想要用一台普通的家用筆電訓練一個GPT模型,必須要花上365年以上的時間(不是天!)。我想,也正是因為NVIDIA所能提供的是算力,所以作為一個CEO在keynote的演講也特別強調了算力的問題,若我們希望能夠讓電腦學習,勢必也得花上為數不小的投資。
讓AI魔法發生
另外,還有一個在演講中提到的概念我也很喜歡,叫做「AI factory」,這裡的AI工廠指的不是在工廠中導入AI,而是一個可以生產AI的工廠。AI本身也可以被規模化,可以讓AI學習、讓AI自身去生產AI。所以黃仁勳說,未來的企業會有兩種工廠,一種工廠仍然生產著企業的主力產品,但另一種工廠則是幫企業生產企業內需要用到的AI。雖然這也可以解釋成,這就是輝達提供解決方案的一種產品類型和應用,他們甚至連整個AI工廠的廠房設計等等都有了相關的規劃,不過,這個概念本身我還是蠻喜歡。
在上課的時候,每次把DEMO做出來之後,我也常常跟學生說,恭喜大家又學會了一項魔法。現在的大語言模型可以做到的事情很廣泛,也很神奇,我們甚至能在terminal裡面看著大語言模型的推論被印出來,彷彿真的看到了一個人把它的思考過程講出來一樣。而演講中有提到的「VLM(Vision Langauge Model)」,將視覺訊息轉化為token並且提供給大語言模型進行推論,這個概念我也是非常喜歡,對於不擅長圖像思考的我來說,我覺得這個概念好貼近人類,就是讓AI用文字語言來思考。
而有了AI工廠若把整個規模化的尺度做出來,AI也有機會不斷的學習、進化,讓它具備了可以推論、思考、創造的能力。所以使用AI來開發AI也是很有可能的一件事情。
克服AI焦慮
在接觸各種AI之後,有些人也許會對技術的發展產生焦慮,認為自己跟不上目前科技的進展。不過,我是保持著一種樂觀的態度,甚至我也覺得這讓手無寸鐵的人有了更多的機會可以擁有不同的魔法和武器可以運用。
我們作為普通人,雖然沒辦法從零開始訓練一個AI,也沒辦法搭建一個AI工廠。但是,我們還是能夠透過串接Open source服務,可以使用到很多這些AI的功能。我們不需要成為魔法的開發者,但是我們可以學會那些咒語,讓我們可以使用魔法。
現在社會瞬息萬變,每天要做的事情很多很雜亂,以前的我,總是會想要盡可能的用頭腦去學習、記得、吸收各式各樣知識,我現在反而會覺得既然有了AI,那麼我可以讓我的腦袋安靜下來。本來的一些苦惱,因為有了AI之後,我覺得就可以放心的交給AI,例如寫程式的速度不夠快、外語不夠好等等。
但是AI都可以彌補這一切,而我們人類只要負責好好的生存,把日子過好就能夠很安然地活在這個有AI的世界。在工作方面的事情,有些事情可以分攤給AI幫忙處理,而關於自己真正想做的,關於自己內心的提升、身體的鍛鍊等等,就又有了更多的時間可以好好照顧自己。所以,其實聽完演講之後,我並沒有因此被激發出了AI焦慮,反倒對於未來,也是樂觀看待,靜待其成,只要慢慢等待時間流逝,原本難解的問題,終究會解開。