Qwen3震撼发布：MoE架构引领性能升级，显著降低部署成本，实现效率飞跃

发布于：2025-04-29 15:11 全文约579字

阿里云通义千问团队发布Qwen3系列模型，共8款，覆盖各类应用场景，首次超越DeepSeek R1，具备混合思维模式。Qwen3系列在性能上领先同尺寸开源模型，适用于移动设备至服务器，标志着中国开源大模型发展新阶段。

阿里云旗下通义千问（Qwen）团队正式发布Qwen3系列模型，共推出8款不同规格的模型，覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型，也是首个配备混合思维模式的国产模型。

Qwen3系列包含6款Dense模型和2款MoE模型:

所有模型均支持128K上下文窗口，并配备了可手动控制的"thinking"开关，实现混合思维模式。

Qwen3系列在同尺寸开源模型中性能领先，尤其是旗舰模型Qwen3-235B-A22B:

小型MoE模型Qwen3-30B-A3B同样令人惊艳:

最小的0.6B模型专为移动设备优化，进一步扩展了Qwen3的应用范围。

Qwen3发布后立即获得了众多平台的"0day级支持":

在线体验:

本地部署:

API接入:

特殊部署:

Qwen3的核心优势包括:

Qwen3的发布标志着中国开源大模型进入新阶段，在性能与部署效率方面实现了双重突破。有兴趣的开发者可通过官方技术博客（https://qwenlm.github.io/blog/qwen3/）了解更多技术细节。