OpenAI即將推出的新一代大型語言模型「Orion」面臨著有限的進步,根據多方報導,這一模型的性能提升並不如預期。
Orion模型概述
- 發布計劃:OpenAI計劃在12月前推出Orion,但具體的發布時間可能會有所變動。
- 性能預測:OpenAI高層曾表示,Orion的性能可能是GPT-4的100倍,但實際測試結果顯示,與GPT-3到GPT-4的飛躍相比,Orion的進步幅度相對較小。
Orion訓練資料結構
Orion的訓練資料結構主要包括來自GPT-4的數據和合成資料。OpenAI正在利用名為「草莓」(Strawberry)的計劃生成高品質的合成數據,以填補現有訓練資料的不足,這些資料有助於提升模型在語言和推理任務上的表現。此外,Orion的訓練過程中,還採用了「測試時計算」技術,以增強模型在推理階段的能力,使其能夠更有效地解決複雜問題。
進步有限的原因
- 數據短缺:OpenAI面臨高質量文本數據短缺的挑戰,這限制了模型的訓練效果。許多內部員工指出,Orion在某些任務(如編程)上的表現並不比之前的模型更可靠。
- 合成數據使用:Orion部分訓練數據來自於AI生成的合成數據,這可能導致其在某些方面與舊模型相似。這種依賴合成數據的策略引發了對模型改進效果的質疑。
內部反饋與挑戰
- 員工反饋:一些使用或測試過Orion的OpenAI員工表示,儘管Orion在語言任務上表現較好,但在編碼等任務上未必超越GPT-4。此外,運行成本也可能高於其他最近發布的模型。
- 策略調整:為應對進步放緩的問題,OpenAI已成立專門團隊研究如何在新訓練數據減少的情況下持續改進模型。
總體而言,儘管Orion被期待為一個重大進步,但其實際性能提升和技術突破卻顯示出一定的局限性。這反映了當前大型語言模型開發中面臨的一系列挑戰。