Anthropic 警告了三天，然后发布了它

「为了安全，我们连续三天对世界发出警告。然后，我们发布了它。」

这不是我的总结。这是 Anthropic 在 2026 年 6 月 6 日到 9 日这四天里，亲自演示的操作流程。1

先警告，再发布

6 月 9 日，Anthropic 发布了 Claude Fable 5，把自家划了 Mythos 级别的模型丢进了公开市场。

Mythos 级的意思是：比 Opus 还高一档。这是 Claude 历史上第一次出现 Opus 之上的产品层级。2

这个级别的模型发布前，Anthropic 刚刚公开警告，说前沿 AI 的进展已经快到「可能在没有人类介入的情况下实现递迴自我改进」，呼籲业界协调安全机制。

警告是 6 月 6 日发的。发布是 6 月 9 日。

三天。

你可以把这解读成「我们足够负责任，把安全机制做好了才发」。也可以解读成「警告归警告，发布日期早就定好了」。

这两种解读都是对的。同一个公司里两件事可以同时发生。真正值得看的，是 Anthropic 用什么方式来「让这件事说得过去」。

同一个大脑，两套防护等级

Fable 5 和 Mythos 5 是同一个底层模型。1

两者的差别只有一个：Fable 5 内置了三类分类器，覆盖网络攻击、生物化学双重用途研究、模型蒸餾三个领域。触发这些分类器，模型不会拒绝你，而是自动降级回 Opus 4.8 处理请求。不是「不行」，是「换配置」。

触发率是多少？官方说平均不到 5%。

也就是说，95% 的请求由 Fable 5 本人处理，不经过任何保险丝。Anthropic 把这一点也写进了官方公告，有点像在向用户保证：你大概率不会遇到那 5%。

Mythos 5——那个没有保险丝的版本——在政府那边，做网络防御和蛋白质设计。Project Glasswing 的生医研究者报告说，Mythos 5 把某些步骤加速了大约十倍。1

你手里的是同一个大脑，装了个偶尔换人接线的开关。

还有一条细节，法务部门看到会皱眉：所有 Mythos 级流量强制保留 30 天，包括此前已签了零留存协议的企业客户。3 理由是检测新型攻击模式，数据到期删除，不用于训练，人工访问留有记录。

听起来合理。但签协议的时候没说会有这个例外情况。

账单翻倍，但数学是对的

Fable 5 的定价是 Opus 4.8 的两倍。输入 $10 每百万 token，输出 $50。1

Anthropic 给出了他们最喜欢的那类案例：Stripe 有一个 5000 万行的 Ruby 代码库，需要全量迁移。正常估算是整个工程团队做两个多月。Fable 5 完成这件事用了一天。

Stripe 自己的原话是：「Fable 5 compressed months of engineering into days.」1

这个逻辑是真实的：一个工程师团队两个月的人力成本，随便是六七位数美元打底。你的 API 账单翻倍，相比之下不值一提。

理论上如此。

Simon Willison 是程序员社区里最早上手 Fable 5 的人之一，他当天主要做的事是给自己开源项目加新功能。结果是什么？首日花了 $110.42，在他 $100 包月的 Max 订阅里全花完了。3

他得出的结论是：Fable 5 是个 beast，把一两天的工作变成了几个小时。他没有抱怨。

但 Reddit 上有人在抱怨：「今年 AI 预算提前见底了。」4

Fable 5 xhigh effort 档位下生成的 SVG 骑车火烈鸟图 — Simon Willison 测试 Fable 5 五档 effort 的 SVG 生成质量，图为 xhigh 档 3

Fable 5 定价与性能关键数据

输入定价（/百万 token）

$10

相比 Opus 4.8

2×

Stripe 代码迁移节省工时

2 个月→1 天

防护降级触发率

<5%

强制数据留存

30天

Loading stats card…

Fable 5 更贵的底气在于：它消耗的 token 数量更少，完成的工作更复杂。账单翻倍，但项目周期从月缩到天。这个逻辑在 Stripe 的例子里成立。

Anthropic 在赌的是：当 AI 从「工具」变成「能独立完成整个项目的数字员工」，企业会愿意用人力成本的框架来为它定价，而不是用软件订阅的框架。

这是个信念，不是数据。

Benchmark 好看，防护有点烦

benchmark 这边，Fable 5 全面领先：Coding Agent Index 77%，比 GPT-5.5 的 76% 高一个点。5 Cognition 的 FrontierCode 最高分，Hebbia 金融推理最高分，Hex 核心分析指标突破 90%。

Loading chart…

数字层面，这确实是目前最强的公开可用模型。

然后是防护这边的真实使用反馈——和官方说的有点不一样。

Reddit 上的 Claude Code 开发者说，分类器的误报率比官方标注的 <5% 要明显得多。代码安全分析、正常的系统管理任务、某些完全合规的研究查询，都踩过线被降回了 Opus。4 有人说得更直接：「guardrails are way too strict... models are optimized for benchmarks, not real use.」

Anthropic 在公告里提前承认了这一点：为了快速发布，保险丝调得比较保守，误报难免，后续会改进。

这是一个公司在两个目标之间的取舍：要么少发布几个月等准确率更好，要么先发出去然后迭代。Anthropic 选了后者——这也是行业里所有人都在做的事。

区别是 Anthropic 在发布前三天刚刚公开告诫行业「不要动作太快」。

IPO 前的这一步棋

Fable 5 的发布时间和 Anthropic 秘密向 SEC 递交 S-1 上市申请的消息，几乎在同一个时间窗口里。2

Fable / Mythos 双轨制，在 IPO 前同时解决了三件事：

向技术社区证明 Anthropic 还在 benchmark 顶点——重要，因为前一周 GPT-5.5 刚出来。向投资人证明有商业化逻辑——Stripe 的 ROI 是现成的 PPT 素材。向监管机构展示「AI 公司可以怎么自律」——Fable/Mythos 双轨架构，把高风险能力定向开放给政府和研究体系，公众版加了自动降级，强制留存用于安全稽核。

第三件事在 IPO 时点上可能最关键。谁率先定义了「前沿 AI 的分级制度」，谁就有可能在日后的立法讨论里充当参考模板。这一点，在估值上值很多钱。

拿不到这些能力的普通用户，换来的是「被管理的 Mythos 级体验」。

帐单更贵，保险丝偶尔误报，但性能确实是目前最强的。

这不是一个让你选「要不要用」的问题——这是 AI 工具这几年形成的现实：你不用，别人用。

三天的意义

回到开头的问题：三天从警告到发布，这是认真的还是走形式的？

可能都不是。更准确的说法是：Anthropic 把一个伦理难题做成了一个产品设计方案。

Fable 5 不是「我们克服了安全顾虑」，而是「我们把安全顾虑本身做成了产品线」。Fable 5 的防护等级是产品规格之一，就像 context window 大小或输出 token 上限一样可以写进文档。

这件事的代价是：你买的不是完整的 Mythos 级能力，而是被管理过的 Mythos 级能力。

那个未经管理的版本，在政府那边，帮研究者把药物设计某些步骤加速了十倍。

你现在拿到的，是同款大脑，装了个偶尔换人接线的开关，还贵两倍。

God bless 产品规格。

（本文配图取自 Simon Willison 使用报告，AI 辅助写作。）