Qwen3震撼发布:MoE架构引领性能升级,显著降低部署成本,实现效率飞跃

发布于: 全文约579字
阿里云通义千问团队发布Qwen3系列模型,共8款,覆盖各类应用场景,首次超越DeepSeek R1,具备混合思维模式。Qwen3系列在性能上领先同尺寸开源模型,适用于移动设备至服务器,标志着中国开源大模型发展新阶段。

阿里云旗下通义千问(Qwen)团队正式发布Qwen3系列模型,共推出8款不同规格的模型,覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型,也是首个配备混合思维模式的国产模型。

Qwen3系列包含6款Dense模型和2款MoE模型:

所有模型均支持128K上下文窗口,并配备了可手动控制的"thinking"开关,实现混合思维模式。

Qwen3系列在同尺寸开源模型中性能领先,尤其是旗舰模型Qwen3-235B-A22B:

小型MoE模型Qwen3-30B-A3B同样令人惊艳:

最小的0.6B模型专为移动设备优化,进一步扩展了Qwen3的应用范围。

Qwen3发布后立即获得了众多平台的"0day级支持":

在线体验:

本地部署:

API接入:

特殊部署:

Qwen3的核心优势包括:

Qwen3的发布标志着中国开源大模型进入新阶段,在性能与部署效率方面实现了双重突破。有兴趣的开发者可通过官方技术博客(https://qwenlm.github.io/blog/qwen3/)了解更多技术细节。

Sitemap.xml
© 2025 Juhe.ai
西安指尖漫步科技有限公司