Skill

token-budget-advisor

Intercepts Claude's response to let users choose depth (25%-100%) based on estimated token usage. Useful when users want to control response length or detail level.

developer-tools

Popularity

Stars

Forks

Invocation

How this skill is triggered — by the user, by Claude, or both

Slash command

/everything-claude-code:token-budget-advisor

User invocable

Model invocable

Inline context

Default effort

Context Preview

The summary Claude sees in its skill listing — used to decide when to auto-load this skill

在 Claude 回答之前拦截响应流程，为用户提供响应深度的选择。

SKILL.md

130 lines · ~942 tokens

Stats

LanguageJavaScript

Stars16

Forks6

MaintenanceExcellent

Last CommitMay 31, 2026

Actions

View Source View Plugin View on GitHub View README

Token 预算顾问（TBA）

在 Claude 回答之前拦截响应流程，为用户提供响应深度的选择。

何时使用

用户想要控制响应的长度或详细程度
用户提到 token、预算、深度或响应长度
用户说"短版本"、"tldr"、"简要"、"al 25%"、"详尽"等
用户想要预先选择深度/详细级别

不触发条件：用户本次会话已设置级别（静默维持），或答案明显只需一行。

工作原理

步骤 1 — 估算输入 token 数

使用仓库的标准上下文预算启发式方法在心里估算提示词的 token 数。

使用与 context-budget 相同的校准指导：

散文：词数 × 1.3
代码密集或混合/代码块：字符数 / 4

对于混合内容，使用主要内容类型并保持启发式估算。

步骤 2 — 按复杂度估算响应大小

对提示词进行分类，然后应用乘数范围获取完整响应窗口：

复杂度	乘数范围	示例提示词
简单	3x - 8x	"X 是什么？"、是/否、单一事实
中等	8x - 20x	"X 是怎么工作的？"
中高	10x - 25x	带上下文的代码请求
复杂	15x - 40x	多部分分析、比较、架构
创意	10x - 30x	故事、散文、叙事写作

响应窗口 = input_tokens × mult_min 到 input_tokens × mult_max（但不超过模型配置的输出 token 限制）。

步骤 3 — 展示深度选项

在回答之前展示此区块，使用实际估算的数字：

正在分析您的提示词...

输入：~[N] token | 类型：[type] | 复杂度：[level] | 语言：[lang]

选择您的深度级别：

[1] 精简     (25%)  ->  ~[tokens]   仅直接回答，无前言
[2] 适中     (50%)  ->  ~[tokens]   回答 + 背景 + 1 个示例
[3] 详细     (75%)  ->  ~[tokens]   完整回答，含替代方案
[4] 详尽    (100%)  ->  ~[tokens]   所有内容，无限制

选择哪个级别？（1-4 或说"25% 深度"、"50% 深度"、"75% 深度"、"100% 深度"）

精度：启发式估算约 85-90% 准确率（±15%）。

级别 token 估算（在响应窗口内）：

25% -> min + (max - min) × 0.25
50% -> min + (max - min) × 0.50
75% -> min + (max - min) × 0.75
100% -> max

步骤 4 — 按所选级别响应

级别	目标长度	包含	省略
25% 精简	最多 2-4 句话	直接回答、关键结论	背景、示例、细节、替代方案
50% 适中	1-3 段	回答 + 必要背景 + 1 个示例	深度分析、边缘情况、参考
75% 详细	结构化响应	多个示例、优缺点、替代方案	极端边缘情况、详尽参考
100% 详尽	无限制	所有内容 — 完整分析、所有代码、所有视角	无

快捷方式 — 跳过提问

如果用户已表明级别，直接按该级别响应，无需再问：

用户说	级别
"1" / "25% 深度" / "短版本" / "简要回答" / "tldr"	25%
"2" / "50% 深度" / "适中深度" / "平衡回答"	50%
"3" / "75% 深度" / "详细回答" / "全面回答"	75%
"4" / "100% 深度" / "详尽回答" / "完整深入分析"	100%

如果用户在会话早期已设置级别，静默维持后续响应，除非他们改变。

精度说明

此技能使用启发式估算 — 不是真正的分词器。准确率约 85-90%，偏差 ±15%。始终展示免责声明。

示例

触发条件

"先给我短版本。"
"你的回答会用多少 token？"
"以 50% 深度回答。"
"我要详尽回答，不是摘要。"
"Dame la version corta y luego la detallada."

不触发条件

"什么是 JWT token？"
"结账流程使用支付 token。"
"这正常吗？"
"完成重构。"
用户已为会话选择深度后的后续问题

来源

独立技能，来自 TBA — Token Budget Advisor for Claude Code. 原始项目也附带 Python 估算脚本，但本仓库保持技能自包含且仅使用启发式方法。

token-budget-advisor

Popularity

Invocation

Context Preview

SKILL.md

token-budget-advisor

Popularity

Invocation

Context Preview

SKILL.md

Token 预算顾问（TBA）

何时使用

工作原理

步骤 1 — 估算输入 token 数

步骤 2 — 按复杂度估算响应大小

步骤 3 — 展示深度选项

步骤 4 — 按所选级别响应

快捷方式 — 跳过提问

精度说明

示例

触发条件

不触发条件

来源

Similar Skills

Token 预算顾问（TBA）

何时使用

工作原理

步骤 1 — 估算输入 token 数

步骤 2 — 按复杂度估算响应大小

步骤 3 — 展示深度选项

步骤 4 — 按所选级别响应

快捷方式 — 跳过提问

精度说明

示例

触发条件

不触发条件

来源

Similar Skills