TinyToolFlareTinyToolFlare

AI 模型成本与上下文计算器

估算 Claude Fable 5 和其他 Claude API 的 1M context、输出 token、prompt caching、Batch API 50% 折扣,以及 Fable 切到 Opus 的预算差异。

成本场景
Batch API 50% 折扣
预计成本
Claude Fable 5
$18.28
平均每次请求 $6.09
Fresh input token
150K · $10/MTok
$1.50
Cache 写入 token
950K · $12.5/MTok
$11.88
Cache hit token
1.9M · $1/MTok
$1.90
输出 token
60K · $50/MTok
$3.00
长上下文预算
100%
每次请求使用 1M / 1M。
Fable 切 Opus 成本对比
当前模型
Claude Fable 5
$18.28
对比模型
Claude Opus 4.8
$9.14
Cache 回本点
5 分钟 cache 回本需要
1 次 cache read
1 小时 cache 回本需要
2 次 cache read
当前 cache 节省
在相同请求数和 Batch 设置下,cache 相比不使用 cache 约节省 $14.73;不使用 cache 约为 $33.00。
估算 Claude Fable 5 的 1M context 预算

输入长 prompt、预计输出和请求次数,快速判断百万 token 上下文是否符合你的单次或批量预算。

Fable 和 Opus 切换前先算差价

用侧边对比结果估算同一工作负载在 Fable、Opus、Sonnet、Haiku 之间路由时的成本差异。

判断 prompt caching 是否值得做

把 fresh input 和稳定共享上下文拆开,查看 cache write、cache hit 和完全不使用 cache 的成本。

本工具的计费假设
价格按每百万 token 计算

计算器使用 USD/MTok 来估算基础输入、cache 写入、cache hit 和输出。不包含税费、企业折扣或云市场的特殊价格。

Batch 折扣可与 cache 叠加

开启 Batch API 时,本工具对 input、output、cache write 和 cache read 都应用 50% 折扣,因为官方价格页说明 Batch 与 prompt caching modifier 可以组合。

长上下文本质仍是 token 计费

Fable 5、Opus 4.8/4.7/4.6、Sonnet 4.6 预设按 1M 窗口处理。即使没有额外长上下文附加费,900K prompt 也会比 9K prompt 贵很多。

常用预设单价
Claude Fable 5
1M context, premium Fable tier
$10/MTok
输出 $50/MTok
Claude Opus 4.8
1M context at standard rates
$5/MTok
输出 $25/MTok
Claude Opus 4.7
1M context at standard rates
$5/MTok
输出 $25/MTok
Claude Opus 4.6
1M context at standard rates
$5/MTok
输出 $25/MTok
AI 模型成本计算器常见问题

关于 Claude Fable 5 成本、cache 回本、Batch API 折扣和长上下文预算的快速答案。