
TL;DR(重点摘要)
- 阿里巴巴推出 Qwen 3:阿里巴巴发布了 Qwen 3 系列 AI 模型,具备混合推理能力,能够在复杂任务中进行深度思考,也能快速响应简单请求。
- 模型多样性:Qwen 3 包含六个密集模型和两个专家混合(MoE)模型,参数规模从 0.6B 到 235B 不等。
- 多语言支持:支持 119 种语言,训练数据超过 36 万亿个 token。
- 开源发布:所有模型均以开源方式发布,开发者可在 Hugging Face 和 GitHub 上获取。
- 应对国际竞争:Qwen 3 的发布加剧了中美在 AI 领域的竞争,推动全球 AI 技术的发展。
🧩 Qwen 3:混合推理模型的先驱
阿里巴巴于 2025 年 4 月 28 日发布了 Qwen 3 系列 AI 模型,标志着其在混合推理领域的重大突破。这些模型能够根据任务的复杂程度,在“思考模式”和“非思考模式”之间切换,实现更高效的处理。
Qwen 3 系列包括六个密集模型和两个专家混合(MoE)模型,参数规模从 0.6B 到 235B 不等。MoE 架构通过将任务分解为子任务,并由专门的“专家”模型处理,提高了计算效率。

🌐 多语言支持与大规模训练数据
Qwen 3 支持多达 119 种语言,训练数据超过 36 万亿个 token,涵盖教科书、问答对、代码片段、AI 生成数据等多种类型。这些改进显著提升了 Qwen 3 相较于前代 Qwen 2 的能力。
🔓 开源发布,促进全球 AI 发展
所有 Qwen 3 模型均以开源方式发布,开发者可在 Hugging Face 和 GitHub 上获取。这一举措不仅促进了全球 AI 技术的发展,也加剧了中美在 AI 领域的竞争。
📈 中美 AI 竞争加剧
Qwen 3 的发布加剧了中美在 AI 领域的竞争。随着中国本土 AI 模型的不断进步,美国的 AI 实验室面临更大压力,推动全球 AI 技术的快速发展。
原文链接:Alibaba unveils Qwen 3, a family of 'hybrid' AI reasoning models | TechCrunch