OpenAI創始人Sam Altman近日表示,AI發展不僅沒有放緩,而且對未來幾年已經勝券在握。這番言論引發了業界對AI發展前景的廣泛討論。OpenAI最新發布的o1系列大模型著重強調推理能力,將推理算力需求推向了新高度。
業內人士認為,o1的發布將進一步提升推理算力需求,隨著大模型廣泛落地,推理算力有望高增。推理被視作大模型"下半場",但現階段AI算力需求的主要增長動力仍來自訓練端,模型廠商算力成本中訓練占比至少七成。
真正的推理端應用才剛剛開始。o1系列在數學和物理推理能力上相比GPT-4o有明顯進步。OpenAI採用強化學習方法,對複雜推理任務逐步思考細化步驟,產生思維鏈並給出過程和答案。這種方法使o1能夠解決更複雜的推理任務,如編寫bash腳本轉置矩陣等需要多步驟推理的問題。
o1模型在某些領域的表現仍有局限。例如在象棋策略分析上,o1試圖像人類一樣分析棋盤,但最終給出的內容完全無意義。相比之下,GPT-4o雖然沒有深刻見解,但至少能猜出看似合理的走法。
這說明o1在某些領域的推理能力仍有待提高。從產業角度看,訓練算力目前仍占主導地位。騰訊雲副總裁沙開波表示,目前超過80%的算力用於訓練,隨著應用落地推理比重會逐漸增加。
IDC預測到2026年雲端推理將占算力62.2%,但目前從金額看訓練仍占70%以上。國內訓練和推理算力比例約為4-5:1。推理端正在崛起。英偉達披露大模型推理場景已占其數據中心業務40%營收。
推理成本也在持續下降,今年單位智能推理成本降低一個數量級,預計明年還會再降一個數量級。但推理落地仍面臨業務場景複雜、數據樣本不足等挑戰。各大廠商已開始布局推理賽道。
華為稱AI應用爆發可能帶動推理算力需求激增至訓練算力的百倍。國產算力廠商如燧原科技、壁仞科技等紛紛加碼推理芯片。
海外玩家如AMD、Cerebras Systems等也加入競爭。Meta為減少對外部供應商依賴,自研推理芯片MTIAv2已發布。OpenAI的o1項目源自去年備受關注的Q*項目,旨在構建能解決複雜數學問題的模型。
今年上半年,該項目重新命名為"草莓"(Strawberry)並推出o1-preview和o1-mini兩個模型。o1突破的關鍵在於強化學習訓練技術,幫助模型以更精確方式進行推理。綜上所述,AI發展正處於關鍵節點。
推理能力的提升為AI帶來新的可能,但同時也面臨諸多挑戰。隨著算力成本下降和應用場景拓展,推理端有望迎來高速增長。
訓練端在相當長一段時間內仍將是AI發展的主要動力。未來幾年,AI行業將繼續在訓練與推理、成本與效能之間尋求平衡,推動技術不斷突破。