微软自家模型孵化中：5,000亿参数媲美OpenAI！

2024/05/08閱讀時間約 2 分鐘

当前，AI显然已经成为了微软的主要议程，在与OpenAI合作开发出业界顶级大模型后，微软似乎并未满足于此。

微软研究院先后不断发布多个小模型（如Phi-3等），以摆脱对GPT-3.5、GPT-4.0等先进模型的依赖，并保持与AI初创公司和开源项目上的竞争力。与此同时，微软成立了Microsoft AI部门，负责整合微软的消费者AI工作以及Copilot、Bing、Edge等产品，并加强自身的AI研究和开发能力。

消息称，微软正在开发一款全新大模型，与Alphabet、谷歌和OpenAI等科技巨头展开新一轮竞争。该AI模型代号为MAI-1，拥有约5,000亿个参数，预计最早将于本月的Build开发者大会上首次亮相。随后，微软首席技术官Kevin Scott也在领英个人账号证实了此消息。

对于微软来说，AI领域的开发采用了“双管齐下”的策略：在为移动设备开发小型本地模型的同时，并不放松对由云端支持的大体量模型的开发。

上月底，微软刚刚推出了一款轻量级AI模型Phi-3-mini，拥有38亿参数，经过3.3万亿token的训练，号称其性能与GPT-3.5等模型势均力敌，并兼容手机设备。重要的是，除了高响应精度外，该模型低廉的成本使其在对客户群的吸引力上优势十足。

不过，Phi系列模型最多使用140亿个参数进行训练，相比之下，MAI-1的规模比微软此前训练过的较小的开源模型大得多，将使用约5,000亿个参数，可以直接与谷歌Gemini和亚马逊Titan、OpenAI的ChatGPT等先进模型相抗衡。也正因如此，它将需要更高的计算能力以及更多的训练数据，价格也将更贵。

该模型的开发将由谷歌DeepMind前联合创始人Mustafa Suleyman负责监督。2010年，Suleyman与其他合伙人创办了AI实验室DeepMind，随后被谷歌收购为旗下AI研究部门。2022年，Suleyman从谷歌离职，创建了AGI公司Inflection AI。

除聘请Suleyman和Inflection AI的主要成员外，微软还以6.5亿美元获得了Inflection技术的知识产权。据两位微软员工称：“MAI-1与Inflection之前发布的模型不同，不过，训练过程可能会用到其训练数据和技术。”

为了训练该款模型，微软正在大力囤积算力资源，已经预留了一大批配备英伟达GPU的服务器，计划到今年年底囤积180万块AI芯片，到2027财年末，预计将在GPU和数据中心上花费约1,000亿美元。

此外，该公司还一直在编制训练数据以优化模型，其中包括来自GPT-4生成的文本，以及外部来源（互联网公共数据）的各种数据集。

#微软##人工智能##大模型#

JohnYung的沙龍

0會員

141內容數

留言0

查看全部

發表第一個留言支持創作者！