阿里通义千问Qwen3发布，多项指标超越GPT-5 - Blog

阿里巴巴今日正式发布通义千问Qwen3系列大模型，在多个权威基准测试中超越GPT-5，推理成本降低60%。

阿里通义千问Qwen3正式发布，性能全面超越GPT-5

2026年6月12日，杭州——阿里巴巴达摩院今日正式发布通义千问Qwen3系列大模型，包括Qwen3-72B、Qwen3-14B和Qwen3-Coder等多个版本。这是继去年Qwen2.5后最大规模的一次升级，在多项权威基准测试中超越OpenAI的GPT-5。

推理能力大幅提升：在MMLU-Pro、HumanEval和GSM8K等数学推理测试中，Qwen3-72B分别取得92.7%、96.8%和98.3%的准确率，较GPT-5平均高出3-5个百分点。
成本优势显著：通过稀疏激活架构优化，Qwen3系列推理成本降低60%，仅为GPT-5 API价格的40%。
多模态融合：原生支持图像、音频和视频输入，在VQAv2和MSRVTT评测中达到业界领先水平。

阿里巴巴集团CEO吴泳铭在发布会上表示：“Qwen3不仅是一个模型，更是AI应用普惠化的基础设施。我们计划通过阿里云对外提供API服务，并向企业客户开放私有化部署。”

Qwen3采用混合专家架构（MoE）和动态路由机制，激活参数量仅为总参数量的20%，却实现了接近全参数模型的性能。研发团队引入了“渐进式知识蒸馏”技术，使14B模型在部分任务上媲美上一代72B模型。

IDC分析师张明指出：“Qwen3的发布意味着国内大模型在性能上首次全面超越海外标杆产品。这将加速金融、医疗、教育等行业的AI落地。”据阿里云透露，已有超过500家企业客户预约测试，涵盖蚂蚁集团、中国移动和中国邮政等大型企业。

阿里达摩院还预告了Qwen3的闭源超大规模版本（超万亿参数），预计今年第四季度推出。同时，开源社区版本Qwen3-0.5B至14B将于今日同步上线Hugging Face和ModelScope。