截至2025年1月,Meta的Llama模型已發展至Llama 3.3版本,並計劃於2025年內推出下一代Llama 4模型。
Llama的發展進程
- Llama 1 (2023年2月)
- 初代模型,專注於開放研究用途。僅提供非商業許可,參數規模從7B到70B。
- Llama 2 (2023年7月)
- 與微軟合作推出,首次允許部分商業用途。提供7B、13B和70B參數版本,並引入指令微調模型(instruction-tuned models)。增加了40%的訓練數據,提升性能。
- Llama 3 系列 (2024年)
- Llama 3 (2024年4月):提供8B和70B參數版本,訓練於15萬億tokens。在多語言支持和推理能力上超越競爭對手。Llama 3.1 (2024年7月):推出405B參數版本,是全球首個開源的超大規模模型。支持多語言對話、工具使用,以及128,000 tokens的長上下文處理能力。Llama 3.2 (2024年9月):增加多模態支持(文本與圖像),並推出適合移動設備的輕量化模型。Llama 3.3 (2024年12月):提供70B參數版本,以更低資源需求達到與405B模型相近的性能。
未來計劃:Llama 4 (2025年)
- 預計在2025年初推出,將分階段發布多個版本。
- 重點提升推理能力和語音交互功能。
- 訓練規模將使用超過10萬個NVIDIA H100 GPU,比現有任何模型規模更大。
- 新增模態和更快性能,進一步擴展應用場景。
總結
目前Llama已發展至Llama 3.3版本,並在多語言支持、長上下文處理、多模態能力等方面取得顯著進步。Meta正積極準備推出Llama 4,以進一步提升推理和語音交互能力,保持其在開源AI領域的領先地位。