艾倫人工智慧研究所很高興地宣布,我們正在著手創建一個開放的、最先進的生成語言模型:AI2 OLMo(Open Language Model)。
OLMo 的規模將與其他最先進的大型語言模型相媲美,參數達到70 億個,預計在2024 年初推出。
OLMo將是一個獨特的開放語言模型,旨在透過圍繞模型創建的各個方面提供訪問和教育,使研究界受益。AI2正在與AMD和CSC合作開發OLMo,使用全AMD處理器驅動的LUMI百萬兆次級超級電腦的新GPU部分- 世界上最環保的超級電腦之一。
OLMo將成為人工智慧研究界許多人首次直接研究語言模型的新途徑。研究所將使OLMo 專案的所有元素都開放, 不僅資料可用,創建資料的程式碼也可以用。
他們還將公開分享和討論圍繞創建此模型的道德和教育考慮因素,來幫助指導語言建模技術的理解和開發。
OLMo項目負責人兼AI2NLP研究高級總監Hannaneh Hajishirzi說:“考慮到科學界,OLMo將專門用於推進語言模型的科學,OLMo將是第一個專門為科學理解和發現而設計的語言模型。”