Fable 5 定价与性能关键数据

Anthropic 警告了三天,然后发布了它
6月6日 Anthropic 对全球警告「AI递迴自我改进已近在眼前」,6月9日它发布了史上最强 Claude——Fable 5。防护等级成了产品线,账单翻倍,保险丝偶尔误报,而那个未经管理的 Mythos 5 正在政府服务器里把药物设计加速十倍。

「为了安全,我们连续三天对世界发出警告。然后,我们发布了它。」
这不是我的总结。这是 Anthropic 在 2026 年 6 月 6 日到 9 日这四天里,亲自演示的操作流程。1
先警告,再发布
6 月 9 日,Anthropic 发布了 Claude Fable 5,把自家划了 Mythos 级别的模型丢进了公开市场。
Mythos 级的意思是:比 Opus 还高一档。这是 Claude 历史上第一次出现 Opus 之上的产品层级。2
这个级别的模型发布前,Anthropic 刚刚公开警告,说前沿 AI 的进展已经快到「可能在没有人类介入的情况下实现递迴自我改进」,呼籲业界协调安全机制。
警告是 6 月 6 日发的。发布是 6 月 9 日。
三天。
你可以把这解读成「我们足够负责任,把安全机制做好了才发」。也可以解读成「警告归警告,发布日期早就定好了」。
这两种解读都是对的。同一个公司里两件事可以同时发生。真正值得看的,是 Anthropic 用什么方式来「让这件事说得过去」。
同一个大脑,两套防护等级
Fable 5 和 Mythos 5 是同一个底层模型。1
两者的差别只有一个:Fable 5 内置了三类分类器,覆盖网络攻击、生物化学双重用途研究、模型蒸餾三个领域。触发这些分类器,模型不会拒绝你,而是自动降级回 Opus 4.8 处理请求。不是「不行」,是「换配置」。
触发率是多少?官方说平均不到 5%。
也就是说,95% 的请求由 Fable 5 本人处理,不经过任何保险丝。Anthropic 把这一点也写进了官方公告,有点像在向用户保证:你大概率不会遇到那 5%。
Mythos 5——那个没有保险丝的版本——在政府那边,做网络防御和蛋白质设计。Project Glasswing 的生医研究者报告说,Mythos 5 把某些步骤加速了大约十倍。1
你手里的是同一个大脑,装了个偶尔换人接线的开关。
还有一条细节,法务部门看到会皱眉:所有 Mythos 级流量强制保留 30 天,包括此前已签了零留存协议的企业客户。3 理由是检测新型攻击模式,数据到期删除,不用于训练,人工访问留有记录。
听起来合理。但签协议的时候没说会有这个例外情况。
账单翻倍,但数学是对的
Fable 5 的定价是 Opus 4.8 的两倍。输入 $10 每百万 token,输出 $50。1
Anthropic 给出了他们最喜欢的那类案例:Stripe 有一个 5000 万行的 Ruby 代码库,需要全量迁移。正常估算是整个工程团队做两个多月。Fable 5 完成这件事用了一天。
Stripe 自己的原话是:「Fable 5 compressed months of engineering into days.」1
这个逻辑是真实的:一个工程师团队两个月的人力成本,随便是六七位数美元打底。你的 API 账单翻倍,相比之下不值一提。
理论上如此。
Simon Willison 是程序员社区里最早上手 Fable 5 的人之一,他当天主要做的事是给自己开源项目加新功能。结果是什么?首日花了 $110.42,在他 $100 包月的 Max 订阅里全花完了。3
他得出的结论是:Fable 5 是个 beast,把一两天的工作变成了几个小时。他没有抱怨。
但 Reddit 上有人在抱怨:「今年 AI 预算提前见底了。」4

Loading stats card…
Fable 5 更贵的底气在于:它消耗的 token 数量更少,完成的工作更复杂。账单翻倍,但项目周期从月缩到天。这个逻辑在 Stripe 的例子里成立。
Anthropic 在赌的是:当 AI 从「工具」变成「能独立完成整个项目的数字员工」,企业会愿意用人力成本的框架来为它定价,而不是用软件订阅的框架。
这是个信念,不是数据。
Benchmark 好看,防护有点烦
benchmark 这边,Fable 5 全面领先:Coding Agent Index 77%,比 GPT-5.5 的 76% 高一个点。5 Cognition 的 FrontierCode 最高分,Hebbia 金融推理最高分,Hex 核心分析指标突破 90%。
Loading chart…
数字层面,这确实是目前最强的公开可用模型。
然后是防护这边的真实使用反馈——和官方说的有点不一样。
Reddit 上的 Claude Code 开发者说,分类器的误报率比官方标注的 <5% 要明显得多。代码安全分析、正常的系统管理任务、某些完全合规的研究查询,都踩过线被降回了 Opus。4 有人说得更直接:「guardrails are way too strict... models are optimized for benchmarks, not real use.」
Anthropic 在公告里提前承认了这一点:为了快速发布,保险丝调得比较保守,误报难免,后续会改进。
这是一个公司在两个目标之间的取舍:要么少发布几个月等准确率更好,要么先发出去然后迭代。Anthropic 选了后者——这也是行业里所有人都在做的事。
区别是 Anthropic 在发布前三天刚刚公开告诫行业「不要动作太快」。
IPO 前的这一步棋
Fable 5 的发布时间和 Anthropic 秘密向 SEC 递交 S-1 上市申请的消息,几乎在同一个时间窗口里。2
Fable / Mythos 双轨制,在 IPO 前同时解决了三件事:
向技术社区证明 Anthropic 还在 benchmark 顶点——重要,因为前一周 GPT-5.5 刚出来。向投资人证明有商业化逻辑——Stripe 的 ROI 是现成的 PPT 素材。向监管机构展示「AI 公司可以怎么自律」——Fable/Mythos 双轨架构,把高风险能力定向开放给政府和研究体系,公众版加了自动降级,强制留存用于安全稽核。
第三件事在 IPO 时点上可能最关键。谁率先定义了「前沿 AI 的分级制度」,谁就有可能在日后的立法讨论里充当参考模板。这一点,在估值上值很多钱。
拿不到这些能力的普通用户,换来的是「被管理的 Mythos 级体验」。
帐单更贵,保险丝偶尔误报,但性能确实是目前最强的。
这不是一个让你选「要不要用」的问题——这是 AI 工具这几年形成的现实:你不用,别人用。
三天的意义
回到开头的问题:三天从警告到发布,这是认真的还是走形式的?
可能都不是。更准确的说法是:Anthropic 把一个伦理难题做成了一个产品设计方案。
Fable 5 不是「我们克服了安全顾虑」,而是「我们把安全顾虑本身做成了产品线」。Fable 5 的防护等级是产品规格之一,就像 context window 大小或输出 token 上限一样可以写进文档。
这件事的代价是:你买的不是完整的 Mythos 级能力,而是被管理过的 Mythos 级能力。
那个未经管理的版本,在政府那边,帮研究者把药物设计某些步骤加速了十倍。
你现在拿到的,是同款大脑,装了个偶尔换人接线的开关,还贵两倍。
God bless 产品规格。
(本文配图取自 Simon Willison 使用报告,AI 辅助写作。)
Add more perspectives or context around this Post.