2026-06-13

美国政府直接断了 Fable 5 的电：监管第一次不规范模型，而是叫停它

美国政府以国家安全为由发出出口管制指令，要求对所有外国国籍者暂停 Fable 5 与 Mythos 5 访问，净效果是 Anthropic 必须对全部客户立即禁用这两款模型。拆解这步监管的真实逻辑，以及它给所有前沿实验室重写的风险账。

ai-governance export-control national-security jailbreak model-deployment

美国政府直接断了 Fable 5 的电：监管第一次不规范模型，而是叫停它 — 图 / Anthropic

概述

2026 年 6 月 12 日，美国政府以国家安全权限为由，向 Anthropic 发出一道出口管制指令：要求暂停所有外国国籍者对 Fable 5 与 Mythos 5 的访问，无论这些人是否在美国境内，连 Anthropic 自己的外籍员工也包含在内。这道指令当天美东时间下午 5:21 送达。

它的措辞是「针对外国国籍者」，但它的落点是全面下架。Anthropic 在声明里讲得很直白：这道命令的净效果，是公司必须立即对全部客户禁用 Fable 5 和 Mythos 5 才能合规。换句话说，一道理论上只限制一部分人的禁令，在工程现实里只能用「对所有人关掉」来执行。其他 Anthropic 模型不受影响。

这件事真正值得记下来的，不是又一次监管摩擦，而是监管动作的形态变了。过去政府对前沿模型的介入，是要求你怎么训练、怎么评估、怎么设防护栏，是在规范模型的行为。这一次，政府没有谈模型该怎么改，而是直接让一款已经上线、服务着数亿人的商用模型停止访问。监管第一次不是去改模型，而是去断它的电。

这步棋

这步棋最关键的设计，是它走的通道：出口管制，而不是任何一种关于模型安全的标准。

出口管制是国家安全权限下的行政指令。它的特点是门槛低、披露少、事前抗辩空间几乎为零。Anthropic 说得很清楚：政府的信函没有给出国家安全关切的具体细节。也就是说，一款上线模型被要求对全体客户停用，而被要求方甚至拿不到完整的理由。这在公开的安全评审流程里几乎不可能发生，但在出口管制的框架下是常态。

为什么这个通道选择本身就是判断？因为它绕开了论证。如果政府走的是「这个模型不达安全标准」的路子，它就得把技术事实摆到台面上，接受质疑和申诉，证明哪条防护栏失效了。而走出口管制，政府只需援引国家安全，就能让模型下线，不必先赢得这场技术辩论。监管的杠杆从「我能否说服你这个模型不安全」变成了「我能否援引一个无需说服你的权限」。后者要省力得多，也危险得多。

Anthropic 自己的态度是分裂的：一边合规执行、立即移除全部用户的访问，一边明确表态不同意。它的原话是，发现一个狭窄的潜在越狱，不应成为召回一款已部署给数亿人的商用模型的理由；如果这个标准被推广到全行业，实际效果将是冻结所有前沿模型供应商的所有新模型部署。这句话点破了这步棋真正的射程：被叫停的不只是一款模型，是「部署后还能不能稳定运营」这件事本身。

真实动机

官方理由是国家安全，触发点疑似是一种绕过或越狱 Fable 5 的方法。政府相信自己掌握了这样一种技术，并向 Anthropic 展示了一次演示。

但 Anthropic 复核这次演示后的结论，和政府的判断差了一大截。它说这次演示只识别出少数早已知道的轻微漏洞，这些漏洞都相对简单，而且其他公开可用的模型根本不需要任何绕过就能发现同样的东西。如果这个复核成立，那政府用来叫停一款服务数亿人模型的依据，是一个连竞品模型都自带、算不上独家威胁的小问题。

这里需要克制，不能替政府编造一个阴谋。信函没给细节，Anthropic 也只看到一次演示，双方掌握的信息都不完整，真相可能卡在中间。但有一点判断是站得住的：当行政方手握一个披露门槛极低、几乎无需举证的工具时，它使用这个工具的实际门槛，会远低于它公开宣称的严重性门槛。也就是说，触发这次行动的技术依据是否真的严重，和政府是否会出手，未必强相关。出口管制这个通道本身，就降低了「值得出手」的标准。

把动机往回推一层，更值得关注的不是这一个漏洞演示，而是政府是否在测试一种新的监管姿态：用一个无需公开论证的权限，去获得对前沿模型部署的实时开关。这次的具体理由也许会被澄清，Anthropic 也说相信这是一场误会、正努力尽快恢复访问。但通道一旦被用过一次，它就成了可复用的先例，这比任何单次理由都更值得记住。

谁被威胁

第一类是其他前沿实验室。这次的逻辑如果成立，就意味着任何一款上线模型，只要被发现一个狭窄的、非通用的越狱，就可能被行政指令叫停。而 Anthropic 在声明里把话讲死了：完美的越狱抵抗，对今天任何模型供应商都不可能做到，行业里每一种防护栏都存在非通用越狱，通用越狱迟早也会被找到。这等于说，按这次的标准，没有哪家实验室的模型能永远免疫这道开关。被威胁的不是 Anthropic 一家，是「部署一款大模型」这个动作的可预期性。

第二类是客户。Fable 5 和 Mythos 5 服务的客户，在毫无预警的情况下，因为一道与他们自身行为无关的指令，被切断了访问。值得点出的细节是，触发因素是国籍身份和国家安全权限，而不是任何客户做错了什么。对企业用户来说，这意味着模型供应商的可用性，现在多了一个他们无法控制、也无法预测的政治变量。一款模型能不能继续用，不再只取决于供应商的技术和商业决定。

第三类是外籍研究者和员工，包括 Anthropic 自己的外国国籍雇员。指令明确把他们划进禁止访问的范围，无论身处境内还是境外。对一个高度依赖全球人才的行业来说，这条把国籍直接接入模型访问权的做法，是个需要警惕的信号：研究者能用哪些工具，开始和他护照上的国别绑定。

该忽略什么

第一个该忽略的误读，是把这件事读成「Fable 5 被证实有严重安全漏洞」。源文件不支持这个结论。政府的信没给国安细节，Anthropic 复核演示后认为只是少数已知的轻微问题，且其他公开模型不用绕过也能复现。Anthropic 还交代了 Fable 上线前的背景：它和美国政府、英国 AISI、多家第三方及内部团队一起，对 Fable 的防护栏做了总计数千小时红队测试，结果显示其防护显著强于任何已部署过的模型，至今没有测试者找到通用越狱。在拿到政府完整技术依据之前，「严重漏洞已坐实」是个跑得太快的判断。

第二个该忽略的，是把它当成 Anthropic 单方面的产品事故或公关危机。这不是产品下线，是被行政指令断电。把焦点放在「Anthropic 的模型出问题了」上，会错过真正的变量：监管首次用出口管制这个通道，对一款上线模型实现了实时停用。

读完该改变的判断只有一个：评估一个前沿模型时，过去你算的是它的能力和安全性；从这一天起，你还得算上一个新变量，就是它会不会在某个下午五点被一道无需公开论证的指令直接关掉。这个变量和模型本身的好坏无关，但它现在是真实的。

常见问题

为什么一道针对外国国籍者的禁令，会导致 Anthropic 对所有客户停用模型？

指令要求对任何外国国籍者，无论在不在美国境内，都暂停 Fable 5 和 Mythos 5 的访问，还包括 Anthropic 自己的外籍员工。要确保不向任何外国国籍者提供访问，技术上最稳妥的合规方式就是对所有人一刀切关停，因为无法在产品层面可靠地只屏蔽外国国籍者。净效果就是全面下架。

Fable 5 真的被发现了严重越狱漏洞吗？

双方说法不一致。Anthropic 复核政府提供的演示后，认为只识别出少数已知的轻微漏洞，且其他公开模型不用绕过也能发现同样的东西。政府未在信函里给出具体国安细节。在拿到政府的完整技术依据之前，把它当成已坐实的严重漏洞是过度解读。

其他 Anthropic 模型受影响吗？

不受影响。指令只针对 Fable 5 和 Mythos 5 两款，其余 Anthropic 模型的访问照常。

出口管制和安全标准下架，有什么区别？

安全标准走的是公开的、可申诉的技术评审流程，是否合规有据可查。出口管制是国家安全权限下的行政指令，门槛更低、披露更少、几乎没有事前抗辩空间。政府这次选了后者，等于绕开了关于模型安全的公开论证。

来源

美国政府要求暂停 Fable 5 与 Mythos 5 访问的声明（Anthropic） / official