From byd-vehicle-scrape
BYD 车型数据爬取与 SQL 转换技能。从 bydhaberfield.com.au 网站爬取车型配置和价格数据,生成 JSON 文件,再转换为 MySQL INSERT SQL 语句。 Use this skill when the user needs to scrape BYD vehicle data, wants to generate SQL for vehicle configurations, or mentions tasks like "爬取 Atto2 数据" or "生成车辆 SQL".
How this skill is triggered — by the user, by Claude, or both
Slash command
/byd-vehicle-scrape:byd-vehicle-scrapeThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
此技能用于从 BYD 澳大利亚官网爬取车型配置和价格数据,并将数据转换为 MySQL INSERT SQL 语句。适用于需要将 BYD 车辆数据导入数据库的场景。
此技能用于从 BYD 澳大利亚官网爬取车型配置和价格数据,并将数据转换为 MySQL INSERT SQL 语句。适用于需要将 BYD 车辆数据导入数据库的场景。
⚠️ 重要:执行目录
务必在用户当前工作目录下执行脚本命令,不要在 skill 安装目录下执行!
脚本会将输出文件写入
process.cwd()(当前工作目录)。如果错误地在 skill 安装目录执行,输出文件会写入 skill 目录,导致:
- 用户难以找到生成的文件
- skill 升级时可能丢失数据
正确做法:使用
cd切换到用户工作目录后,再执行脚本命令。
用户请求 → 爬取指定车型 → 生成 JSON 文件 → 转换为 SQL 文件 → 输出路径
| 车型 | 类型 | 车身类型 | 座位数 |
|---|---|---|---|
| Atto 1 | Electric | Hatchback | 5 |
| Atto 2 | Electric | SUV | 5 |
| Atto 3 | Electric | SUV | 5 |
| Dolphin | Electric | Hatchback | 5 |
| Seal | Electric | Sedan | 5 |
| M6 | Electric | Sedan | 5 |
| Shark | Electric | Sedan | 5 |
执行前确认:确保当前目录是用户工作目录(运行
pwd确认),输出将写入./byd-output/json/
# 爬取单个车型(在用户工作目录下执行)
node ~/.claude/skills/byd-vehicle-scrape/scripts/scrape-byd-variant-details.js --model="Atto 2"
# 爬取多个车型(逗号分隔)
node ~/.claude/skills/byd-vehicle-scrape/scripts/scrape-byd-variant-details.js --model="Atto 2,Atto 3"
# 爬取所有车型
node ~/.claude/skills/byd-vehicle-scrape/scripts/scrape-byd-variant-details.js
| 参数 | 默认值 | 说明 |
|---|---|---|
--model | 全部 | 指定车型名称,多个用逗号分隔 |
--delay | 500 | 请求间延迟 (ms) |
--retries | 3 | 失败重试次数 |
--timeout | 60000 | 页面加载超时 (ms) |
--help | - | 显示帮助信息 |
JSON 文件保存到用户工作目录下的 byd-output/json/ 目录,命名格式:
byd-variant-details_{车型名}_{时间戳}.jsonbyd-variant-details_{车型数}models_{时间戳}.jsonbyd-variant-details_all_{时间戳}.json执行前确认:确保当前目录是用户工作目录,且已存在
./byd-output/json/目录
# 使用默认文件(最新的 JSON 文件)
node ~/.claude/skills/byd-vehicle-scrape/scripts/generate_sql.mjs
# 指定输入文件
node ~/.claude/skills/byd-vehicle-scrape/scripts/generate_sql.mjs byd-variant-details_atto-2_2026-03-13_10-30-00.json
SQL 文件保存到用户工作目录下的 byd-output/sql/ 目录,命名格式:
insert_statements_{车型标识}_{时间戳}.sql
SQL 文件包含:
START TRANSACTION / COMMIT 事务包装loan_vehicle_configs 表的 INSERT 语句(车型配置信息)loan_vehicle_prices 表的 INSERT 语句(所有价格组合)# 确保在用户工作目录下执行(例如:/Users/sen/projects/my-project)
pwd # 确认当前目录
# 1. 爬取 Atto 2 车型数据(输出到 ./byd-output/json/)
node ~/.claude/skills/byd-vehicle-scrape/scripts/scrape-byd-variant-details.js --model="Atto 2"
# 2. 生成 SQL(使用刚刚生成的 JSON 文件,输出到 ./byd-output/sql/)
node ~/.claude/skills/byd-vehicle-scrape/scripts/generate_sql.mjs byd-variant-details_atto-2_2026-03-13_10-30-00.json
# 3. 查看输出文件
ls -la ./byd-output/json/
ls -la ./byd-output/sql/
Playwright 爬虫脚本,负责:
SQL 生成脚本,负责:
loan_vehicle_configs 表的 INSERT 语句loan_vehicle_prices 表的 INSERT 语句(批量插入)存储车型配置汇总信息,包括车型名称、类型、座位数、变体数量、颜色/轮毂/内饰选项、价格范围等。
存储每个价格组合的详细信息,包括变体、颜色、轮毂、内饰的价格,以及印花税、上牌费、交强险、经销商交车费、促销优惠等。
byd-output/ 子目录。执行前请确认 pwd 返回的是用户期望的工作目录。npx playwright install chromiumnpx claudepluginhub sancodeee/sen-claude-hub --plugin byd-vehicle-scrapeQueries public CarJam NZ vehicle info (plate, VIN, chassis) via a no-login CLI. Returns make/model/year/colour/odometer snippets with structured JSON output.
Systematically evaluates used car listings to identify red flags, verify pricing against market data, and decide whether to pursue an in-person inspection.
Extracts structured data (tables, lists, prices) from web pages via multi-strategy scraping with pagination, validation, transforms, and CSV/JSON/Markdown export.