Measures performance baselines, detects regressions before/after PRs, and compares stack alternatives. Supports page, API, build, and before/after comparison modes.
How this skill is triggered — by the user, by Claude, or both
Slash command
/everything-claude-code:benchmarkThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
- 在 PR 之前和之后测量性能影响
通过浏览器 MCP 测量真实浏览器指标:
1. 导航到每个目标 URL
2. 测量核心 Web 指标:
- LCP(最大内容绘制)— 目标 < 2.5s
- CLS(累积布局偏移)— 目标 < 0.1
- INP(交互到下次绘制)— 目标 < 200ms
- FCP(首次内容绘制)— 目标 < 1.8s
- TTFB(首字节时间)— 目标 < 800ms
3. 测量资源大小:
- 总页面权重(目标 < 1MB)
- JS 包大小(目标 < 200KB gzipped)
- CSS 大小
- 图像权重
- 第三方脚本权重
4. 计算网络请求数
5. 检查渲染阻塞资源
对 API 端点进行基准测试:
1. 每个端点命中 100 次
2. 测量:p50、p95、p99 延迟
3. 跟踪:响应大小、状态代码
4. 负载下测试:10 个并发请求
5. 与 SLA 目标比较
测量开发反馈循环:
1. 冷构建时间
2. 热重载时间 (HMR)
3. 测试套件持续时间
4. TypeScript 检查时间
5. Lint 时间
6. Docker 构建时间
在更改之前和之后运行以测量影响:
/benchmark baseline # 保存当前指标
# ... 进行更改 ...
/benchmark compare # 与基线比较
输出:
| 指标 | 之前 | 之后 | 增量 | 判定 |
|--------|--------|-------|-------|---------|
| LCP | 1.2s | 1.4s | +200ms | 警告:WARN |
| Bundle | 180KB | 175KB | -5KB | ✓ 更好 |
| Build | 12s | 14s | +2s | 警告:WARN |
将基线存储在 .ecc/benchmarks/ 中作为 JSON。Git 跟踪以便团队共享基线。
/benchmark compare/canary-watch 配对进行部署后监控/browser-qa 配对进行完整的发货前检查清单npx claudepluginhub aaione/everything-claude-code-zhMeasures performance baselines, detects regressions before/after PRs, and compares stack alternatives. Supports page, API, build, and before/after modes.
Benchmarks page performance via Core Web Vitals and resource sizes, API latency under load, build times including HMR and Docker, and detects regressions before/after PRs with delta tables.
Creates and runs reliable benchmarks to measure code change impacts on performance, including latency, throughput. Supports Node.js (vitest, tinybench), Python (pytest-benchmark), frontend (Lighthouse CI), with warmup, stats.