智谱AI发布开源模型GLM-5.2,在网络安全漏洞检测方面匹敌Anthropic受限模型Mythos,中美AI安全能力差距大幅缩小,引发美国安全界高度关注。
智谱AI开源模型GLM-5.2横空出世
6月28日,北京智谱AI(Z.ai)正式发布其开源权重模型GLM-5.2,在网络安全与漏洞检测领域引发震动。多家独立研究机构的测试结果表明,GLM-5.2在特定网络安全任务上的表现已经能够匹敌Anthropic旗下受出口管制的Mythos模型,标志着中国在安全关键型AI领域取得了重大突破。
测试数据令人震惊
据《华尔街日报》和The Verge报道,独立安全研究机构Graphistry使用其CyBT-CTF基准测试对GLM-5.2进行了评估,发现该模型在网络安全调查任务上的解决率与Anthropic的Opus 4.8持平。更引人注目的是,安全公司Semgrep的IDOR检测基准测试中,GLM-5.2取得了39%的F1分数,超过了Claude Code的32%。
Graphistry表示,这是他们首次推荐一个开源模型用于接近前沿水平的网络安全体验。这意味着安全研究人员现在可以在本地运行一个与受限美国模型能力相当的漏洞检测工具,而无需依赖云端API。
开源策略的战略意义
GLM-5.2采用MIT开源许可证发布,任何人都可以下载、微调甚至移除安全控制。这一策略与美国政府对Anthropic Fable 5和Mythos 5实施的严格出口管制形成鲜明对比。
6月12日,美国政府以国家安全为由,下令Anthropic暂停所有外国公民对Fable 5和Mythos 5的访问权限。这一举措旨在阻止中国等国家获取最先进的AI安全能力。然而,仅仅两周后,中国就用一个开源模型证明了技术封锁的局限性。
中美AI安全博弈升级
GLM-5.2的出现,使得美国政府限制中国获取先进AI模型的战略遭遇重大挑战。一位不愿具名的美国国防情报安全官员表示,开源模型的可获取性使得管控变得几乎不可能。
虽然GLM-5.2在通用任务上仍落后于OpenAI的GPT-5和Anthropic的最新系统,但在网络安全这一特定领域,中美之间的能力差距已被大幅压缩。这对于全球AI安全格局而言,既是技术进步的标志,也带来了新的治理难题。
对行业的影响
GLM-5.2的发布引发了技术社区的广泛讨论。支持者认为开源有助于全球安全社区共同提升防御能力;批评者则担心恶意行为者可以轻易获取强大的漏洞检测工具。
无论立场如何,GLM-5.2的发布都标志着一个重要转折点:AI安全能力的民主化正在加速,传统的出口管制策略面临前所未有的挑战。