目前坊間在聊下一代的 AI 題材時,逐漸將目光轉往矽光子與 CPO ,認為這是下一代資料中心的解決方案,也引來市場的關注。而究竟這是什麼呢?
最簡單的講,AI Server 追求的算力,就像是一間工廠的生產量,而像大家熟知的緯創、技嘉、廣達,都是提升產量的硬體,但產生大量的資料量時,傳輸速度也要跟上,所產出的資訊才能有效被利用。
所以如果 AI 的運力是就是工廠的生廠速度的話,那而 CPO 就是加速物流速度的解決方案,兩者都要共同提升,貨品才能送到終端,這一切才有意義。
說法參考來源:https://www.youtube.com/watch?v=vQCwRbwSLSY
現在大家口耳相傳的 AI Server ,你可以想像成是一台算力超強的電腦,而將一堆伺服器放在一個空間裡,一起處理大量的資訊量,便是 Data Center 的概念。而在 Data Center 裡伺服器之間會以光纖串連,以利資料傳輸,形成一個乙太網路(類似公司內網)。
因為過往電腦元件之間在傳輸數據時,都是透過銅線來傳輸電信號,但由於以銅為媒介會有傳輸數度不夠快,且信號衰減快、易受干擾的缺點,而解決方案就是使用「光纖」來取代銅線進行資料傳送。
上述概念簡單整理如下:
看完以上內容後,你是否想過:伺服器如何將資料送到哪台伺服器?又要透過什麼接收別台伺服器傳過來的信號?這時候就需要介紹「交換器」這個元件了。
在資料中心中,資料如果要在伺服器之間傳送,都要靠「交換器」去負責將資料傳出 / 接收,但由於伺服器內所運算的資料是電信號,需要轉換成光信號才能以光纖作為媒介傳到另一台伺服器,同時從另一台伺服器接收到的光信號也需要轉換成電信號才能夠進行使用。
所以資料在離開 / 進入交換器之前,會先經過光收發模組,也就是將光、電信號轉換的元件。
不過有一個問題,就是光纖只能達到伺服器的機櫃外圍,但是從外圍內部的 AI 晶片之間,仍有約 10 公分的距離,儘管看起來不多,但由於 AI 伺服器彼此傳輸的資料是數十億為單位,只要有0.001秒的落差,乘上數十億,便是巨大的資料時間落差,所以這時候如果光纖越靠近 AI 晶片,運算速度越快,而解決方法就是將光收發模組跟交換器封裝在一起,節省中間的距離,這就是 CPO 的概念。
而如何封裝在一起呢?過往一個光收發模組需要包含光接收器、光波導、光調變器、電流電壓放大器、驅動IC、交換器等元件,這些元件都混分散在一塊PCB板上,但現在我們會利用矽光子技術,將這些元件集成到一個矽晶片上,也就是以目前最熟悉的矽為材質,在上面刻下光所行走的通道,有點像是過往我們說的積體電路晶片,只是上面的電路改成光路,這麼一來就能將上述的光收發模組微縮成極小的光晶片,也就是「光引擎」。
而也需要透過矽光子這個技術,才能將光收發模組與交換器晶片封裝在一起,實現 CPO 技術。
簡單整理概念如下:
然後依上述概念,將光引擎與交換器晶片(ASIC)封裝在一起,取代PCB板的可插拔式光收發模組,以減少光纖到晶片的距離,便會成為下面的模樣:
而在資料中心的交換器領域上, Broadcom 為絕對霸主,根據 2021 年外資報告內容表示,資料中心的交換器晶片中, Broadcom的市佔率高達九成。
另外, Broadcom 也在 9/1 的法說會提到,他們在上一季已經收到下一代 Tomahawk 5 交換機大量訂單,計劃在未來 6 個月內開始向幾個超大規模客戶發貨,而且會跳過 400G,直接以 800 Gb 取代。
而這裡提到的400G、800G,指的就是傳輸規格, G 代表Gbps,即每秒十億位元,而400G、800G也就是指數據傳輸的最大頻寬(象徵速度)。
而在現代網路架構中,每一個個節點、路由器、交換器都需要光收發模組進行資訊轉換,光收發模組目前的主流傳輸規格為 100G ,可以想像成最大能透過換的資訊量,而 800G 的交換器便象徵著需要搭載 8 個光收發模組( 實際Tomahawk 5 我還沒看過,不知道整體構造,這裡是先用推論的數字 )。
Broadcom 交換機構造與相關供應鏈:
此外, Broadcom 也在法說會中同時提到,Tomahawk 5 交換機的晶片會採用 CPO 技術製成,加上 AI 算力需求不斷提升,我認為 CPO 會是未來資料中心傳輸速度上的解方。
這裡再順便提一下好了,目前超大型的資料中心基本上都集中在北美,而佔地也都是非常可怕,像是 Facebook 正在新加坡建立一個超大型資料中心,其高度為11層,面積為180萬平方英尺,大概等於180 個操場的佔地,比一般的大學校區都還大,但在既有的硬體下, 根據廣達董事長林百里表示: 「AI算力需求正以每三個月翻倍的速度快速成長」。
不過所資料中心建好了就不能擴建,土地跟建材也很貴的狀況下,要怎麼因應快速增長的算力呢?目前既有的資料中心需要不斷更換這些內部元件,以滿足資訊量瘋狂增加的需求。
所以當 AI 算力瘋狂增加時, CPO 這塊領域的需求也會變得非常明確。
而日月光也表示, 2024 年將是CPO的甜蜜點,屆時CPO的產品會比目前插拔式的光纖接收器(上面富果那張 PCB 做傳統收發器的圖)便宜,而當時的時空背景是預期 2024 年開始量產 400G,但 Broadcom 在法說會上提出要用 800G 取代 400G 的消息後,一切的成長力道都將重新洗牌。
且後續 800G 的滲漏率也可望快於過去機構所做的調查: