科技一周 |谷歌最新人工智慧模型Gemini 以及AMD AI晶片 MI300，帶來甚麼改變! 20231215

Jeffery Huang

發佈於科技一周 | Jeff 陪你掌握一周科技趨勢

2023/12/15閱讀時間約 16 分鐘

Sundar Pichai bets big on infusing AI in Google Search engine

我覺得谷歌會大贏。

不單單是看所謂的AI模型的效能有多強，而是看整體的公司架構以及現在的產業現況。就微軟與Open AI 而言，當我看到Sam Altman 與Satya Nadella 講話的時候，他的問法是說: 『奈德拉你怎麼看待我們的合作?』

我基本上不會對我們緊密合作的夥伴這樣說話，這只是個直覺；再加上他們近期的亂流，我覺得Open AI 這間公司在一個信任為主的年代，不見得會一路好下去。

而谷歌的部分，AI研發機構是他們內部的部門，沒有內部與外部之間的問題，同時，兩大AI 神人現在事權統一，也顧及彼此的感受與面子，最新的AI 模型取名Gemini [[ˋdʒɛmə͵naɪ] 雙子座，就因為這個AI 模型是Google Brain 和Google Deepmind 兩個團隊合作的結果，而這兩個領導人，一位是Jeff Dean (被Wired 雜誌稱為不需要AI 的人類)，另外一位Demis Hassabis也是隨便出去都可以號召一群人跟著他們走。

但他們選擇留下來繼續打拼，其實說到底跟Open AI 的那群創業的工程師一樣，就是選擇自己喜歡的風格、認同的價值，如此而已。延續上一篇所說的， Open AI 是Y combinator 創業顛覆世界的start-up 精神的最佳代表，要的是拿到AGI 的聖杯，並在過程中輾壓其他人，有點像十字軍東征的狂熱與混亂。而微軟的合作也容易理解，奈德拉當然是要藉由Open AI 的合作撬開谷歌的霸權，你說他是要下架谷歌也不為過。

但谷歌在皮猜的領導下，『從底層架構思考全局』的思維，這不但是現在面對AI 的戰略，更是皮猜這個人從年輕到中年(今年51歲)的職涯關鍵思維，相對穩健。

Chrome 一開始是一個甚麼? 瀏覽器。瀏覽器當時2000 年大概有數十個吧，列舉幾個當時知名的瀏覽器，裡面還沒有Chrome 呢!

Lynx、Netscape、Opera、IE、Mac、 Mozilla

不可思議，2008 年Chrome 面市之後，Chrome 不但成為今天的第一，還從瀏覽器變成Chrome OS，然後又變成Chrome Book ，然後從美金299 一路做到499 ，從學校低年級使用的強固型筆電變成上班族在拿的商務筆電。當初研發瀏覽器的主要負責人 Sundar Pichai 也變成谷歌以及字母集團的董事長。

特別他說的這段話，我覺得所言不虛。

Sundar Pichai : “It's very rare that you can work on a technology at a foundational level, and it simultaneously can impact all our products.”

華爾街日報:" The search company will also use the algorithms to power products such as Bard, its answer to ChatGPT, and mobile-phone features that are capable of running without any network connection."

總之谷歌這一次的發佈Gemini ，我們幫大家整理三個不能錯過的重點，也恭喜聽眾(歡迎加入會員)，上周的報告中，我們提到Cybertruck 把電力系統從 12V 變為48 V ，也是後來Cybertruck 故事發展的重點，馬斯克還把這個線路圖直接寄給福特的CEO ，對方還很高興，讓我們複習一下主要的理由，因為電壓升高>電流可以減少 >而熱能是電流的平方，所以發發熱可以減少，線材可以減輕。

以下整理Google 最新人工智慧模型的三個重點:

第一個重點: AI 正式進入多模時代

朝向AGI 的一大步!複習下AGI 就是所有人類的智力活動(Intelligentt task )都會被取代，那我們在進行所謂的智力活動的時候，使用到我們的幾乎是五官對嗎? 上實驗課老師會要你觀察(眼睛) 、親自試做( physical/manual) 還有老師講解(聽的=耳朵) ，跟著覆頌(嘴吧) ，老師示範或是畫圖講解(圖片和影片) ，學生寫心得(文字) ，

透過多管道擷取資訊，才能在腦中形成完整的印象，現在的Gemini 也是如此: 不但可以多管道吸收，也可以多管道輸出。

它能夠看相片、文字、辨識聲音，但是據說聲音的部分是直接處理聲音，而不是變為文字再用文字處理，因為很多的細節 (nuance )在轉換的過程會流失，其實這也是我們的頻道從第一天就堅持一定要節錄英文段落的原因，因為很多原文語氣細節，在轉換為中文的過程中，也會丟失很多有意義的細節，所以我們真的必須用原文來理解，但可以用中文來高速傳輸更大量的資料。

這就是多模的概念。

multimodal

US /ˌmʌl.tiˈmoʊ.dəl/ /ˌmʌl.taɪˈmoʊ.dəl/ 多種方式的

Demis Hassabis:" Gemini is our largest and most capable model, it means that Gemini can understand the world around us in the way that we do and absorb any type of input and output, so not just text like most models, but also code, audio, image and video."

Open AI 也應該已經具備多模的能力，在平常互動的過程中，我發現有幾次我根本沒有請他生成圖片，但可能它自己覺得一圖勝千言，太複雜的他就會自己畫圖來溝通，這個跟人類很像，如果很複雜，有些人就會想要去拿白板筆用白板來講解(我就是這樣)，所以所謂的多模，也不用想得太複雜，人類的溝通與表達，本來就是多模的。

第二個重點: 產品發表會風格的改變

這次的簡報風格大大的不同。當然一方面是因應短影音，他把一整個切成好多小的單位，一個短影片一個主題，只有一個超過5分鐘。簡報已經不是只有一個人站在台上接受大家歡呼的那種思維，完全是平實的表達。用文字，和短影片來傳達全貌。

娓娓道來 + Demo

只要講到簡報，數十年來的洗禮，就是準備個好幾十頁的簡報，一個人穿的帥帥的從頭講到尾嗎? 沒有喔，現在好多風格種類，甚至像這一次Google 的影片，你就坐著就好，拿著手機架著拍，娓娓道來你的感覺就好了，不用講 " I can't wait to introduce to you our latest development." " Isn’t that incredible?”

賈伯斯2007 年介紹iPhone 的那一套，現在已經演化成很多不同版本，不用在被caught up in presentation mode。行銷公關的團隊思維也要隨著改變。短片自己公司做，而不是讓Youtuber 剪接(把traffic留在自家頻道) ，搭配文字部落格 (SEO)，讓CEO 講自己的感覺(更真實接地氣) 這是我看到很大的一個收穫。

第三個重點: gemini nano 帶來數位產品視覺寒武紀的大爆發

未來所有的東西都會有AI ，上幾集的Humane AI 是不是有點走太快? 還是他遇見2024 的AI設備大爆發，所以先搶先贏呢? 這個 gemini nano 如同皮猜在五月時候說的，可以offline ，那麼跟Meta 的眼鏡思維搭載一起，Humane 的胸針，還有手環、手錶，全部都可以在離線使用人工智慧功能。

那關鍵來了，既然他有多模的能力，那視覺方面你要怎麼讓他看到? 這邊讓我聯想起物種的寒武紀大爆發! 從寒武紀初乍現的天光到眼睛的誕生，學者就提出，光與視覺就是開啟寒武紀物種大爆發關鍵的催化劑。人類的角膜，到今天都是一個只能移植的東西，鏡頭的解析度、重量有多麼重要? 聚焦的功能、鏡片的彎曲度，不管光學鏡頭還是塑膠鏡頭，我認為未來的機會非常大。

結論: 谷歌的使命是organize world information.

當設備能夠閱讀並理解 (make sense of) 這個世界，資料量應該會再次暴漲 (上一次是網路世代連結了世界的資料量)，這個資料量會從海量變成宇宙量，那你也只能依靠AI 來幫你選擇，此時此地對你最有幫助的資料。所以谷歌的任務將不只是organize ( 就像百科全書，organize 你也看不完；也不只是search ，因為你search 的結果也是很多)，而是提供你在此刻最需要的內容，那就需要AI 。

接下來可能是present the world informaiton寫到這邊你就會感覺到世界的層次已經分為好幾層:

第一層是真實的世界，但是我們受限於時空無法完全認知；
第二層是世界的代表 the representation of the world 可供數位查詢；
第三層是你需要的資訊、服務、bespoke or tailer made with AI ，這樣的認知就離第一層更遠了。這個時候，還是回到信任。誰有過去數十年的搜尋作基底? 誰擁有大家的信任。

在AI 的時代，我認為品牌與信任會比上個時代更受到重視。信任、垂直整合、具備算力與晶片。這是我覺得谷歌這間公司本質上會大贏的原因。

AMD 的重量新品 MI300X

最一開始要談的是，AI 資料中心的市場大小，連Lisa 都估計不準。還記得我們提到過，Lisa 蘇說未來幾年的AI 資料中心的產業規模大概是150 billion，黃仁勳說 250billion，那時候我覺得可能黃仁勳比較敢喊，Lisa 保守穩健一些，但即使是那樣(150 billion) ，算起來的年複合成長率也高達50%，

結果你猜怎麼著，我相信人的個性還是沒變，但是數字變了，經過這幾個月的體會，Lisa 改口了，資料中心AI加速器市場的整體潛在市場規模將達到4,000億美元，年均複合成長率（CAGR）超過70％。

這70%到底要怎麼理解? 其實我的想法式這樣，現在的AI 是在胚胎期，那你就想想胚他需要的營養，就是媽媽胃口會變好，平常不吃的東西會想拿來吃，那只是胚胎發育的初期，到了後期，媽媽的胃口會變成兩個人的份量，到青少年時期，要吸收的營養更是胚胎時期的數百倍!

AI 的成長需要的營養就是運算能力。很恐怖。

年複合成長率70% 這是甚麼概念? 用數字來看，1991 年的電腦市場是101 million (台), 2000 年是500million (台)，期間10年，用所謂的年複合成長CAGR 的算法來看，年複合成長率式多少? 才 17%。NB成長率自2000年後超越DT，成長速度驚人，年複合成長率(CAGR)高達20.78%。

所以我認為年複合成長率 70% 這是無法想像的。

有了市場概念的數字，接下來就看AMD 怎麼掌握商機! 分為三點報告

① GPU 工藝與科技的極致展現!

153 billion transister 這個數字中文是一千五百三十億個電晶體

等一下，就是MI300X 這顆晶片上面的電晶體數字，這個數字要怎麼理解?

摩爾定律和當前挑戰

1965年，工程師 Gordon Moore 觀察到，積體電路中的組件數量每年增加一倍。他預測，這種趨勢將至少持續十年。

1975年（當時領先的處理器的電晶體數量約為 4,000-5,000），他將預測的速率修改為每兩年增加一倍。這就是半導體行業中大名鼎鼎的摩爾定律。 Moore 預測，到 2015 年，隨著電晶體的小型化在原子級別達到根本性障礙，IC 密度的增長速度將在未來十年左右達到飽和點。

AMD 於 2019 年推出第二代 EPYC™ 伺服器 CPU 的電晶體數量已達到近 400 億個。

所以2019是40 billion電晶體, 2023年剛剛發佈的又變成將近四倍 153 billion，如果以原本摩爾定律每兩年增加一倍的速率來看，四年過去應該是增加兩倍，但事實上卻是增加為四倍! 當然它是用小晶片堆疊來達成的，而不是在單一顆晶片上。但是密度持續增加這個趨勢是不變的。

②晶片速度快了以後會怎麼樣? 傳輸速度也要跟上

好像你買了一台頂級咖啡機之後會怎樣? 你會順便買頂級的磨豆機、訂購頂級的咖啡豆，可能連桌子都要換一個。傳輸速度要變快。

發表會裡面又出現了我們常聽到的ethernet 乙太網路這個名詞，無巧不巧，而特斯拉的Cybertruck 裡面也是走乙太網路。代表乙太網路在AI 的高速傳輸時代，是正當紅的科技，那麼也就代表了所有乙太網路高階晶片的公司應該會有很不錯的發展。答案是肯定的，Broadcom 在AMD發表會之後，股價噴出就是一個例子。

③上次提到的AI PC 在這個發表會裡面有很清楚地描述

關鍵又回到以前Wintel 陣營，透過軟體升級來驅動硬體升級，只是這一次，應該變成Amd + Microsoft，微軟的Copilot 會有許多的功能在AMD Ryzen AI 上面會得到最佳體驗，你會不會買內含AMD 晶片的筆電?

我們看到關於co-pilot 就是在多個微軟 app 之間的資料互通等等，以及包含有影像處理增強、背景模糊等等，全部都真的很實用，所以2024年，現在的Ryzen 晶片應該已經在大量出貨，大陸的工廠正在大量趕工，趕在農曆年前出貨上架，

網路的時代有一種東西叫做Thin client 後來怎麼樣都沒有成功，因為光靠網路是行不通的，你必須在自己的電腦上面暫存一些東西，處理一些東西，所以個人電腦筆記型電腦這個產業都已經三十年了還是相當蓬勃，因為就是需要前端有力的預先處理。

其實AI 的處理也是一樣的: 不可能甚麼都傳回去在天崖海角的資料中心，必然有一些在個人電腦上面先處理的。

Microsoft 和谷歌誰輸誰贏? 我覺得就是各分一片天。

明年五月Google I/O 會不會有新的 Chromebook ? 我覺得當然會!搶攻高階筆電市場，Google 已經宣布推出全新品牌 Chromebook Plus，將授權給符合硬體條件的筆電，配有獨家 AI 功能助力，加以區分產品定位，使 Chromebook 跨出入門電腦的既定印象。

我覺得2024 年的電腦業會有至少10~15% 的成長，資料中心會成長25%~50%，但是AMD的財務長說面對當前各家廠商磨刀霍霍的 AI PC 市場發展，最快要到 2025 年才會推動 PC 銷量的成長，此說法等於潑了許多科技廠商一盆冷水。

這個我大膽地做一個預測，商場本來就是這樣: 強者可以示弱，他讓你誤會我沒有要大舉出貨呀，讓你不要來綁樁呀。事實上能夠在2024 搶占先機先讓大家體驗建立AI PC 第一品牌的印象，難道還要等到2025年?

另外一個理由，我覺得他是要把產能留給Data Center產品線。原則讓我還是非常看好AI PC。當然PC 產業這一塊大家都熟，個股的部分就要再花點時間更新一下研究一下了，可能包含記憶體、高速傳輸晶片，乃至於散熱模組，電源供應器等等，都會有不錯的熱潮。

最後，我覺得谷歌永遠不會把網路的問答當作他的主力產品。這個牽涉到谷歌的生意模式，他的搜尋與關鍵字廣告發展得太完備了，如果你問他問題，他直接告訴你答案，而不是給你連結，那也會降低它的營收。可行的做法其實就是現在的AI服務 Bard，有點像吧檯的酒保，你可以先跟他聊聊，大概有個概念之後，就可以按下Google 去找線索，出發的時候你就按下搜尋符號，那就又回到傳統谷歌的勢力範圍啦!

或許聊天與搜尋都是人類的天性!