Intercepts Claude's response to let users choose depth (25%-100%) based on estimated token usage. Useful when users want to control response length or detail level.
How this skill is triggered — by the user, by Claude, or both
Slash command
/everything-claude-code:token-budget-advisorThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
在 Claude 回答之前拦截响应流程,为用户提供响应深度的选择。
在 Claude 回答之前拦截响应流程,为用户提供响应深度的选择。
不触发条件:用户本次会话已设置级别(静默维持),或答案明显只需一行。
使用仓库的标准上下文预算启发式方法在心里估算提示词的 token 数。
使用与 context-budget 相同的校准指导:
词数 × 1.3字符数 / 4对于混合内容,使用主要内容类型并保持启发式估算。
对提示词进行分类,然后应用乘数范围获取完整响应窗口:
| 复杂度 | 乘数范围 | 示例提示词 |
|---|---|---|
| 简单 | 3x - 8x | "X 是什么?"、是/否、单一事实 |
| 中等 | 8x - 20x | "X 是怎么工作的?" |
| 中高 | 10x - 25x | 带上下文的代码请求 |
| 复杂 | 15x - 40x | 多部分分析、比较、架构 |
| 创意 | 10x - 30x | 故事、散文、叙事写作 |
响应窗口 = input_tokens × mult_min 到 input_tokens × mult_max(但不超过模型配置的输出 token 限制)。
在回答之前展示此区块,使用实际估算的数字:
正在分析您的提示词...
输入:~[N] token | 类型:[type] | 复杂度:[level] | 语言:[lang]
选择您的深度级别:
[1] 精简 (25%) -> ~[tokens] 仅直接回答,无前言
[2] 适中 (50%) -> ~[tokens] 回答 + 背景 + 1 个示例
[3] 详细 (75%) -> ~[tokens] 完整回答,含替代方案
[4] 详尽 (100%) -> ~[tokens] 所有内容,无限制
选择哪个级别?(1-4 或说"25% 深度"、"50% 深度"、"75% 深度"、"100% 深度")
精度:启发式估算约 85-90% 准确率(±15%)。
级别 token 估算(在响应窗口内):
min + (max - min) × 0.25min + (max - min) × 0.50min + (max - min) × 0.75max| 级别 | 目标长度 | 包含 | 省略 |
|---|---|---|---|
| 25% 精简 | 最多 2-4 句话 | 直接回答、关键结论 | 背景、示例、细节、替代方案 |
| 50% 适中 | 1-3 段 | 回答 + 必要背景 + 1 个示例 | 深度分析、边缘情况、参考 |
| 75% 详细 | 结构化响应 | 多个示例、优缺点、替代方案 | 极端边缘情况、详尽参考 |
| 100% 详尽 | 无限制 | 所有内容 — 完整分析、所有代码、所有视角 | 无 |
如果用户已表明级别,直接按该级别响应,无需再问:
| 用户说 | 级别 |
|---|---|
| "1" / "25% 深度" / "短版本" / "简要回答" / "tldr" | 25% |
| "2" / "50% 深度" / "适中深度" / "平衡回答" | 50% |
| "3" / "75% 深度" / "详细回答" / "全面回答" | 75% |
| "4" / "100% 深度" / "详尽回答" / "完整深入分析" | 100% |
如果用户在会话早期已设置级别,静默维持后续响应,除非他们改变。
此技能使用启发式估算 — 不是真正的分词器。准确率约 85-90%,偏差 ±15%。始终展示免责声明。
独立技能,来自 TBA — Token Budget Advisor for Claude Code. 原始项目也附带 Python 估算脚本,但本仓库保持技能自包含且仅使用启发式方法。
npx claudepluginhub aaione/everything-claude-code-zhEstimates input token count and response complexity, then offers a menu to choose response depth (brief, detailed, exhaustive) before answering. Use to control token consumption in Claude Code.
Compresses verbose responses by eliminating filler, hype, hedging, framing, and transitions to save 200-400 tokens per response while preserving clarity. Use for token-efficient, direct AI outputs.
Reduces token waste through anti-sycophancy rules, tool-call budgets per task type, one-pass coding discipline, and read-before-write enforcement.