Skill

benchmark

Measures performance baselines, detects regressions before/after PRs, and compares stack alternatives. Supports page, API, build, and before/after comparison modes.

performance

Popularity

Stars

Forks

Invocation

How this skill is triggered — by the user, by Claude, or both

Slash command

/everything-claude-code:benchmark

User invocable

Model invocable

Inline context

Default effort

Context Preview

The summary Claude sees in its skill listing — used to decide when to auto-load this skill

- 在 PR 之前和之后测量性能影响

SKILL.md

94 lines · ~322 tokens

Stats

LanguageJavaScript

Stars16

Forks6

MaintenanceExcellent

Last CommitMay 31, 2026

Actions

View Source View Plugin View on GitHub View README

基准测试 — 性能基线和回归检测

何时使用

在 PR 之前和之后测量性能影响
为项目设置性能基线
当用户报告"感觉慢"时
发布之前 — 确保满足性能目标
将您的堆栈与替代方案进行比较

工作原理

模式 1：页面性能

通过浏览器 MCP 测量真实浏览器指标：

1. 导航到每个目标 URL
2. 测量核心 Web 指标：
   - LCP（最大内容绘制）— 目标 < 2.5s
   - CLS（累积布局偏移）— 目标 < 0.1
   - INP（交互到下次绘制）— 目标 < 200ms
   - FCP（首次内容绘制）— 目标 < 1.8s
   - TTFB（首字节时间）— 目标 < 800ms
3. 测量资源大小：
   - 总页面权重（目标 < 1MB）
   - JS 包大小（目标 < 200KB gzipped）
   - CSS 大小
   - 图像权重
   - 第三方脚本权重
4. 计算网络请求数
5. 检查渲染阻塞资源

模式 2：API 性能

对 API 端点进行基准测试：

1. 每个端点命中 100 次
2. 测量：p50、p95、p99 延迟
3. 跟踪：响应大小、状态代码
4. 负载下测试：10 个并发请求
5. 与 SLA 目标比较

模式 3：构建性能

测量开发反馈循环：

1. 冷构建时间
2. 热重载时间 (HMR)
3. 测试套件持续时间
4. TypeScript 检查时间
5. Lint 时间
6. Docker 构建时间

模式 4：之前/之后比较

在更改之前和之后运行以测量影响：

/benchmark baseline    # 保存当前指标
# ... 进行更改 ...
/benchmark compare     # 与基线比较

输出：

| 指标 | 之前 | 之后 | 增量 | 判定 |
|--------|--------|-------|-------|---------|
| LCP | 1.2s | 1.4s | +200ms | 警告：WARN |
| Bundle | 180KB | 175KB | -5KB | ✓ 更好 |
| Build | 12s | 14s | +2s | 警告：WARN |

输出

将基线存储在 .ecc/benchmarks/ 中作为 JSON。Git 跟踪以便团队共享基线。

集成

CI：在每个 PR 上运行 /benchmark compare
与 /canary-watch 配对进行部署后监控
与 /browser-qa 配对进行完整的发货前检查清单

benchmark

Popularity

Invocation

Context Preview

SKILL.md

benchmark

Popularity

Invocation

Context Preview

SKILL.md

基准测试 — 性能基线和回归检测

何时使用

工作原理

模式 1：页面性能

模式 2：API 性能

模式 3：构建性能

模式 4：之前/之后比较

输出

集成

Similar Skills

基准测试 — 性能基线和回归检测

何时使用

工作原理

模式 1：页面性能

模式 2：API 性能

模式 3：构建性能

模式 4：之前/之后比较

输出

集成

Similar Skills