NVIDIA 再次出現在這期內容中,是今年的第三次。前兩次分別是在五月 Computex 有機會參加黃仁勳的 keynote、團訪,寫了一些關於他對於 Nvidia 的未來想像與觀察。
今天讓來聊點不一樣的,往回看 Nvidia 早期成立故事、之中的轉折,以及如何決策新的商業機會。
這次的參考資料,主要有《Acquired》三集介紹 NVIDIA 不同時期的內容(The GPU Company、The Machine Learning Company、The Dawn of the AI Era)、Ben Thompson 對黃仁勳的兩次採訪(Manufacturing Intelligence、AI’s iPhone Moment),以及 NVIDIA 官網內的文章等。
今年 5 月,NVIDIA 市值躍升全美前五,正式加入 1 兆美元俱樂部。
回到 1993 年 Nvidia 剛成立的時候,他們身處在競爭激烈、獲利率低的市場中,有將近 90 個競爭者都在製造圖形處理器(GPU)做著類似的事。
但到了今天, Nvidia 卻擁有 83% 的獨立 GPU 市佔率,並且為桌機、筆電提供 GPU 。
此外,Nvidia 也正開創了全新的市場。他們為機器學習、神經網路、深度學習提供動力的硬體和軟體開發工具,這些都在雲、資料中心(data center),也將定義了整個十年的運算。
成立 Nvidia 的初衷很簡單,因為他們看見了加速運算的未來。
剛滿 30 歲的黃仁勳與另外兩位曾在 Sun Microsystems 擔任工程師的好友 Chris Malachowsky、Curtis Priem 一起決定創業。
看見加速運算的未來,大致上可以分成兩點:
這時,黃仁勳也決定攻讀史丹佛大學的電機電子工程碩士學。最終,他花了 8 年的時間取得學位。後來,他成為 AMD 的微處理器設計師,在這段工作時間,也讓他理解到打造更快晶片的可能性,以及它未來的長期性發展。
他跟隨 AMD 前同事的步伐,到了一家最早在做特殊應用積體電路(ASIC,根據產品不同需求而定製的積體電路,來減輕 CPU 的工作量)的公司 LSI Logic 擔任 CoreWare 總監。這意味著他們可以為其他公司定製設計晶片。
當時要上映的《侏羅紀公園》,片中對於 3D 繪圖的需求非常高,但當時要完成 3D 繪圖需要 SGI 工作站(SGI workstations),這非常非常昂貴,只有軍隊或侏儸紀公園的團隊可以負擔的起。
於是,黃仁勳和 Malachowsky、Priem 想說有沒有可能他們來做定製的顯卡,減輕 CPU 圖形工作的負載,在普通 PC 上就能滿足 3D 繪圖的需求,就像 SGI 工作站一樣。
除了 3D 電腦圖形需求大增外,在 PC 上玩遊戲的需求也正在起飛。雖然他們不確定電子遊戲會不會成為一個巨大的市場,可能只有都是面向小孩的市場,但可以確定的是大家喜歡遊戲,這也是 3D 繪圖應用的重要場景之一。
有了題目之後,黃仁勳和 Malachowsky、Priem 決定一起創業。他向 LSI Logic 執行長 Wilf Corrigan 遞出辭呈。
他聽完後,問了黃仁勳幾個關鍵問題:「誰在做 PC 遊戲?是否有開發人員生態系?」
Corrigan 只丟了一句「你會回來的」,曾任快捷半導體執行長的他,還是幫黃仁勳聯絡了他的前同事 Don Valentine,後來 Valentine 成立紅衫資本,也是 LSI Logic 最大投資者。過程中雖然有些插曲,不過最終順利拿到他的 2000 萬資金。
Nvidia 最一開始的時候,沒有名字,但他們把正在設計的第一個 GPU 命名為 dot-NV,NV 是 next version 的縮寫。
就像不斷在開發下一個版本,於是他們翻了拉丁語看有沒有開頭 NV 的單字,找到了 Invidia ,意思是忌妒,他們覺得這很讚,要成為這行讓人忌妒的領頭羊,最終把 I 給去掉了,以 Nvidia 為名。
時間快轉到 1997 年,Nvidia 發佈了第三代顯示晶片 RIVA 128。這是拯救 Nvidia 差點破產的重要產品,而且也是 Nvidia 技術方向的重大變化。黃仁勳在一次分享說到這段故事:
必須先把晶片打造出來,才能寫軟體。在軟體寫完後,才能讓晶片能用,但如果這時發現晶片有 bug,就要去修改晶片,再拿去生產晶片。整個開發流程,從送交製造到正式量產所需要耗時兩年。
但當時他們沒有兩年,只剩下 9 個月,他們的錢就要燒完了。
如果我把錢拿去投資一台機器,「讓我們在生產晶片之前,就可以開始寫軟體」的機器,就可以,在送交製造的時候,可以確保它是完美的,只剩下唯一一次的生產機會。
他們後來從一間快破產的公司,用了 100 萬美元(相當他們可以再活 3 個月的資金)買了模擬器 ikos emulator。這是一台像冰箱一樣的機器內,用來模擬晶片的運作。
簡單來說,這台機器模擬已經開發出來的晶片,他們可以直接在上面開發軟體,進行各種功能的測試。他們用了這台機器打造 RIVA 128,量產後基本上晶片是正常的,也支援了 Microsoft DirectX 其中 8 種的渲染模式。
(Microsoft 提出 32 種渲染模式,但黃仁勳跑遍了全球遊戲開發商跟他們說這 8 種就夠用了,拜託不要用其他 24 種)
RIVA 128 推出後大受歡迎,在四個月內銷售了 100 萬台。他們也趁勝追擊在 1999 年初上市,當時市值來到 6 億美元。同年的秋天,推出了第一個 GPU GeForce 256,它的繪圖運算表現都比市場上的其他產品要好上五倍。
接下來,他們以超越摩爾定律(18-24 個月會晶片的效能提高一倍)的速度,幾乎是以 6 個月為發貨速度,開發了 GeForce 2(2000 年春天)、GeForce 2 Ultra(2000 年秋天)。
到了 2001 年春天推出 GeForce 3,這也是可程式化著色器的重要產品,為 Xbox 提供了動力。六個月後,GeForce 3 Ti500 問世。
《Acquired》在談 Nvidia 的第二部分點出了,他們第一個十年裡,奠定了三件蠻重要的事。(我有做了一些微調,讓背後脈絡更好懂)
第一,發貨週期縮短,讓他們有更多餘裕領先競爭者。以 6 個月為發貨週期的速度,是 Nvidia 在早期的競爭優勢之一。當其他將近 90 家的公司都要以 18-24 個月來開發新的晶片,他們用更快的速度、開發出性能更好的晶片。
延續前面黃仁勳分享的故事,或許會想為什麼當時他們不籌更多錢?他給的答案也很直覺,對投資人來說有其他 90 家可以相信,雖然我們相信自己,但沒有人會相信我們。他們也證明自己有優勢可以領先競爭者。
第二,奠定軟硬體整合的基礎。Nvidia 為自家顯卡寫了驅動程式。當時,其他顯卡公司和大多數週邊公司,都讓他們的下游合作夥伴來幫他們寫驅動程式。
不過,Nvidia 為什麼要特別自己寫驅動程式?背後有兩個主要考量:盡可能地確保品質,讓用戶在任何系統上有良好的體驗、開始在公司內建立初階軟體開發者,當時並沒有太多公司有這樣的能力。
第三,則是可程式設計著色器。這裡有個的轉變是從晶片設計跨到了可程式設計著色器。黃仁勳提到,會有這樣的轉變是,以 RIVA 128 的後一代晶片 RIVA TNT 來說,它是「固定功能管線」(Fixed Function Pipeline)。
也就是,當時的顯示晶片中各個單元的功能是「固定」的,根據晶片上設計好的模式來運作,這是為了更快速、避免過於複雜的架構設計。
基本上,每個步驟要做哪些事是固定的,不能隨著場合不同而有所變動。(關於更多解釋,可參考可程式化管線架構與 Shader Model)
但「固定功能管線」也有些困境,要做整個畫面得先把所有畫面拆成更小的單位來製作,耗時也耗錢。所以,他們在想有沒有可能讓 GPU 內的各個部分更有彈性點,後來就有了「可程式化管線」(Programmable Pipeline)的誕生。
Nvidia 發明了可程式設計著色器,使得對執行要加速的硬體進行程式設計成為可能,也為圖形之外的應用程式進行設計。
到了 2006 年,Nvidia 投入了大量資源來建構後來的 CUDA 平台。他們發明了 CUDA 程式設計模型,來解決加快運算、加速工作負載等挑戰。
CUDA 是用於 GPU 的平行運算平台和程式設計模型。但實際上,當時推的時候,華爾街沒有人看懂這件事。
這裡 Thompson 和黃仁勳進行訪談時,說了一段蠻精闢的觀察,也讓我看懂了 Nvidia 真正在做的事:
你構建這個可程式設計的著色器模型,聽起來你認為人們會抓住這個機會,但你意識到你必須真正構建機會,你必須構建所有的基礎設施,你必須構建 CUDA,你必須構建所有的 SDK(軟體開發套件),這幾乎是 Nvidia 剛剛從一家硬體公司轉變為真正整合軟硬體巨頭的地方。
透過 CUDA,可以利用 GPU 的運算能力加速應用程式。Nvidia 免費提供 CUDA 給大眾,而只有自家賣的晶片才能與 CUDA 相容。除了免費外,程式設計簡易性和效能大幅提升是 CUDA 平台廣受採用的主要原因之一。
能讓 CUDA 成功的一大關鍵是它的生態系統。這是個聚集大量開發者的社群,也讓他們能夠深入整合他們的硬體、軟體和解決方案。
和其他競爭者相較,這也是他們提供客戶差異化產品之處。他們希望透過投資 CUDA,來讓通用計算 GPU 成為可能。
黃仁勳在訪談中提到,15 年來,我們一直在推進 CUDA 和生態系的發展,而且還在不斷增加。我們在 GPU、加速庫、系統和應用程式間的反覆運算中不斷優化,同時通過增加我們加速的新應用程式域來擴展我們平臺的覆蓋範圍。…我們擁有 150 多個 SDK,服務於遊戲和設計、生命科學和地球科學、量子計算、人工智慧、網路安全、5G 和機器人等行業。
不管是 Thompson 或是《Acquired》都會提到一個論點:在某些方面來說,Nvidia 很像 Apple。
這是因為 Apple 是以深度整合軟硬體聞名,而它的商業模式是建立自家平臺生態系給開發者、他們透過出售硬體來賺錢。基本上 Nvidia 也在做這樣的事。
提出「破壞式創新」的 Clay Christensen,向來對 Apple 抱持悲觀態度,從預測 iPod 即將死亡到預測 iPhone 會失敗。他的看法是閉源雖然可以在一段時間內取得成功,但長遠來看開源的技術方式總是會勝出。即便如此,但 Apple 依然存活且過得很好。
如果按照 Christensen 的想法,可能也有很大程度會不看好 Nvidia。但實際上,在這兩個案例中都有「規模化」的重要因素,才能讓他們走到今天。
不過,當時幾乎沒有人相信 Nvidia 可以證明投資 CUDA 的合理規模,或是存在一個市場可以讓他們達到一定的規模。但最終這賭注成功了,如今全球約有 3000 的 AI 新創,大多新創都在使用 Nvidia 的 CUDA 平台。
先前,有寫過 Nvidia 的近期發展、未來想像,一直很想了解 Nvidia 的早期故事,剛好趁這個機會把他補足。
這次回過頭深入了解 Nvidia 的早期背景之後,知道每階段的業務重點想要解決什麼樣的問題,也有了不同轉換。
但背後的為什麼,或是把它串起來的原因是什麼,一開始都是像個知識/資訊點,零散地拼湊起來,直到讀到了 Ben Thompson 和黃仁勳的訪談,才有種 connect the dot、打通任督二脈的感覺。而且也從黃仁勳回答上得到應證「每一次的業務重點轉換,都是刻意的安排」,這也成就 Nvidia 的偉大之處 。
今年初搬到 Substack 後,開始搞懂熟悉這平台後,也發現了一些很讚的內容,很值得介紹給大家認識的電子報。
今天要介紹的《知識倉鼠》就是其中之一,我應該算蠻早就訂閱了,也歷經之中的一些主題和風格的轉變。
作者元魁一開始都寫和 AI 資訊、工具為主的內容,對我來說可以很快速地認識那週有哪些新發展、新工具等。
他還實作過一個科技島讀的 AI 機器人,對身為程式麻瓜的我來說,這是我不會做,也不會寫,可是我會很蠻好奇的題目。
很感謝他花了 20 小時、65 美元實作出來,還把他寫成一期超長的電子報。
這一陣子他希望可以帶給大家更深度的內容,也嘗試用不同風格繼續創作。像是,如何運用 AI 閱讀《晶片戰爭》,之中也加入了他的反思,像是為什麼他覺得有時候 AI 總結的訊息不是太有用等。
喜歡這類內容的朋友,歡迎訂閱🐹 知識倉鼠
最後,想邀請你花 3-5 分鐘的時間填寫讀者回饋,讓我有機會認識你,也希望聽到你的回饋,幫助我在內容製作上有更好的地方,感謝~