Blog posts and course content are currently in Chinese. Translation is in progress.
Back to Blog

阿里通义千问Qwen3发布,多项指标超越GPT-5

2026年6月12日5 min read
阿里通义千问Qwen3发布,多项指标超越GPT-5

阿里巴巴今日正式发布通义千问Qwen3系列大模型,在多个权威基准测试中超越GPT-5,推理成本降低60%。

阿里通义千问Qwen3正式发布,性能全面超越GPT-5

2026年6月12日,杭州——阿里巴巴达摩院今日正式发布通义千问Qwen3系列大模型,包括Qwen3-72B、Qwen3-14B和Qwen3-Coder等多个版本。这是继去年Qwen2.5后最大规模的一次升级,在多项权威基准测试中超越OpenAI的GPT-5。

核心亮点:

  • 推理能力大幅提升:在MMLU-Pro、HumanEval和GSM8K等数学推理测试中,Qwen3-72B分别取得92.7%、96.8%和98.3%的准确率,较GPT-5平均高出3-5个百分点。
  • 成本优势显著:通过稀疏激活架构优化,Qwen3系列推理成本降低60%,仅为GPT-5 API价格的40%。
  • 多模态融合:原生支持图像、音频和视频输入,在VQAv2和MSRVTT评测中达到业界领先水平。

阿里巴巴集团CEO吴泳铭在发布会上表示:“Qwen3不仅是一个模型,更是AI应用普惠化的基础设施。我们计划通过阿里云对外提供API服务,并向企业客户开放私有化部署。”

技术突破:

Qwen3采用混合专家架构(MoE)和动态路由机制,激活参数量仅为总参数量的20%,却实现了接近全参数模型的性能。研发团队引入了“渐进式知识蒸馏”技术,使14B模型在部分任务上媲美上一代72B模型。

行业影响:

IDC分析师张明指出:“Qwen3的发布意味着国内大模型在性能上首次全面超越海外标杆产品。这将加速金融、医疗、教育等行业的AI落地。”据阿里云透露,已有超过500家企业客户预约测试,涵盖蚂蚁集团、中国移动和中国邮政等大型企业。

未来展望:

阿里达摩院还预告了Qwen3的闭源超大规模版本(超万亿参数),预计今年第四季度推出。同时,开源社区版本Qwen3-0.5B至14B将于今日同步上线Hugging Face和ModelScope。