近兩年人工智慧(AI)的發展速度一日千里,特別是大型語言模型(LLM)的競爭者一刻不懈怠的推陳出新,提出不同想像。年初OpenAI的圖像生成Sora,三月初Anthropic的Cloude3上線,都為未來科技的創想帶來一波波的震撼。而其中自然也不能錯過一直批評OpenAI應該選擇開源的Elon Musk的X AI公司,果然遵守老闆的意志,將他們的大型語言模型Grok-1開源,不僅展現了對AI技術開放共享的承諾,也預示著行業未來可能也會有不同於資本競爭、算力對抗的新發展方向。
Grok-1的特色
與Google的Gemini、OpenAI的GPT-4以及Anthropic的Cloude3相比,Grok-1有幾個顯著的特點。首先,Grok-1擁有3140億參數,這使其成為目前較大的語言模型之一。更重要的是,Grok-1採用的混合專家(MoE)架構,這是一種在處理特定任務時可以動態調整運算資源分配的方法。這種架構提供了與傳統大型語言模型不同的處理效率和靈活性,可能使Grok-1在處理特定查詢時更加高效。相較GPT-4的廣泛知識覆蓋和Cloude2的道德考量,Grok-1的開源特性和技術規模為開發者提供了前所未有的自定義和優化機會。與同樣開源思考的Meta的Llama2相比,模型大小無疑也增加了部署的難度。
開源代表的意義
Grok-1的開源可能會對AI技術的演進和市場競爭產生深遠影響。首先,過去將研究成果設定為公司資產的壁壘,無疑是會對技術普及及進步帶來很多的限制。視企業研發投資如無物的將如此先進技術開源,可以促進全球範圍內的創新。開發者和公司可以看到Grok-1的source code和權重,這意味著他們可以在此基礎上進行改進、定制和實驗,加速AI應用的開發。開源的信仰在道德層面是選擇願意相信人性為善的。在理想的情境下,Grok-1的開源可能會激勵更多的透明性和合作。但另一方面,OpenAI也曾多次提到的如此強大的技術若誤遭惡用,將會造成難以想像的風險。
從市場競爭的角度來看,Grok-1的開源提供了一個平等的競爭環境,特別是對於那些資源較少的創新者和初創公司。這使他們能夠利用頂尖的AI技術,而不必從頭開始開發,從而降低進入門檻。另一方面也制衡了國家主義通過資本控制技術去進行競爭時,落後國家將受到的歧視。
所謂的AI民主,是否是真議題?
以台灣來說,在模型競爭上相較世界各國,雖然可能有人才或是硬體算力的支撐,但實際也難獲得競爭門票。這樣的科技劣勢其實除了中美兩國,都是各國擔心的問題。以大型語言模型是否能理解小語種及地區文化為出發點,這樣的科技歧視在AI不斷進入生活的同時,會產生更多的傷害。Grok-1的開源無疑是一個重大事件,因為它可能在概念上為AI技術的演進和市場競爭投入了變數。但AI技術本質上不論是算力、人才、知識面都具有極高的門檻,光靠一個模型的開源,看來還遠遠不夠達成所謂的AI平權。終歸來說,馬誼郎大哥的說到做到,卻是許多企業經營者難以做到,甚至難以理解的!