Skill

gitcode-publish

Publish model README to GitCode with auto-inferred YAML frontmatter tags. The agent auto-discovers the README from /workspace — user only needs to provide the model name. Use this skill whenever the user mentions pushing/publishing a model to GitCode, uploading model documentation, adding frontmatter tags to a model README, preparing a model card for GitCode, looking up a model on HuggingFace, or searching for a model ID. Even if they don't say "GitCode" explicitly, trigger when they talk about tagging a model README with HuggingFace-style metadata, need to find the exact HuggingFace model ID, or when they give just a model name and want to publish it.

Invocation

How this skill is triggered — by the user, by Claude, or both

Slash command

/gitcode-publish:gitcode-publish

User invocable

Model invocable

Inline context

Default effort

Context Preview

The summary Claude sees in its skill listing — used to decide when to auto-load this skill

为模型 README.md 自动推断并添加 YAML frontmatter 标签，然后推送到 GitCode 仓库。

SKILL.md

340 lines · ~2.4k tokens

Stats

LanguagePython

Parent stars0

MaintenanceExcellent

Last CommitMay 6, 2026

Actions

View Source View Plugin View on GitHub View README

Stats

Actions

GitCode 模型发布

为模型 README.md 自动推断并添加 YAML frontmatter 标签，然后推送到 GitCode 仓库。

工作流程

1. 获取模型信息

用户只需提供模型名称（如 HuggingFace model ID Qwen/Qwen2-VL-7B-Instruct、ModelScope ID、或本地路径/目录名）。

Agent 自动搜索 README

获取模型名称后，agent 按以下优先级在 /workspace 下自动搜索模型对应的 README.md：

如果模型名包含 /（如 org/model-name），首先搜索 /workspace/model-name/README.md
用 find /workspace -maxdepth 4 -name "README.md" 列出所有 README，结合 grep -i 过滤与模型名称匹配的路径
如果以上未找到，搜索模型目录下的 config.json（find /workspace -maxdepth 4 -name "config.json"），读取 _name_or_path 字段匹配模型名称来定位

如果自动搜索找到唯一匹配，直接使用；如果有多个候选，展示给用户选择；如果没有找到，再询问用户 README 路径作为兜底。

记下搜索到的 README 路径（下面用 $README_PATH 表示），后续步骤需要用它。

确定模型路径

模型路径按以下优先级确定：

如果搜索 README 时已经找到包含 config.json 的模型目录，直接使用该路径读取配置
如果用户提供的是 HuggingFace model ID，优先从 API 获取元数据（走 2a），同时如果本地缓存目录 ~/.cache/huggingface/hub/models--{org}--{name}/ 存在，读取本地 config 补充信息
如果自动搜索未找到，询问用户模型路径

关键变更：用户不再需要手动提供 README 路径，agent 自动从 /workspace 搜索。

1.5. 解析模糊的 HuggingFace 模型 ID

当用户提供的 HuggingFace model ID 不精确时（缺少命名空间、只有系列名、记不清全名等），不要猜测，用 huggingface_hub 库搜索并让用户确认。

触发条件（满足任一即触发搜索）：

model ID 中没有 /（缺少命名空间，如 "Qwen2-VL" 而非 "Qwen/Qwen2-VL-7B-Instruct"）
用户明确说不确定完整 model ID（"好像叫..."、"记不清..."、"大概是..."）
后续步骤 2a 中 HF API 返回 404

搜索命令（按 downloads 降序，优先展示热门模型。优先使用 hf-mirror.com 镜像，不可达时回退直连）：

python3 << 'PYEOF'
import os
from huggingface_hub import HfApi

# 优先用镜像，不行再直连
for endpoint in ['https://hf-mirror.com', None]:
    try:
        if endpoint:
            os.environ['HF_ENDPOINT'] = endpoint
        api = HfApi()
        models = list(api.list_models(search="<搜索词>", limit=15, sort="downloads"))
        break
    except Exception:
        continue

print(f"{'#':<3} {'Model ID':<55} {'Pipeline':<30} {'Downloads':<12} {'Created'}")
print("-" * 115)
for i, m in enumerate(models, 1):
    created = str(m.created_at).split(' ')[0] if m.created_at else '-'
    print(f"{i:<3} {m.modelId:<55} {(m.pipeline_tag or '-'):<30} {m.downloads:>10,}  {created}")
PYEOF

展示搜索结果，用表格形式列出匹配的模型（显示 model ID、pipeline_tag、下载量、更新时间），然后让用户通过序号或完整 model ID 确认。

用户确认后，用确认的完整 model ID 继续后续步骤。

2. 获取模型元数据

优先级：平台 API > 本地 config 推断

根据步骤 1.2 中确定的模型来源类型，选择对应的数据源。

2a. HuggingFace model ID → 用 API 获取真实标签

HuggingFace Hub API 返回的 pipeline_tag、tags、library_name、license 就是平台上的真实值，无需猜测：

curl -sL --retry 3 --retry-delay 1 "https://hf-mirror.com/api/models/MODEL_ID" | python3 -c "
import sys, json
d = json.load(sys.stdin)
card = d.get('cardData', {}) or {}
result = {
    'pipeline_tag': d.get('pipeline_tag', ''),
    'tags': d.get('tags', []),
    'library_name': d.get('library_name', ''),
    'license': card.get('license', ''),
    'model_type': d.get('config', {}).get('model_type', '') if d.get('config') else '',
}
print(json.dumps(result, indent=2, ensure_ascii=False))
"

如果 hf-mirror 不可达，用 HuggingFace 直连作为后备：

curl -sL --retry 3 --retry-delay 1 "https://huggingface.co/api/models/MODEL_ID" | python3 -c "..."  # 同上

如果 API 返回 404（model ID 不存在），说明用户提供的 model ID 可能有误。此时应返回 步骤 1.5，用搜索词（取 model ID 中最有区分度的部分）进行模糊搜索，让用户从匹配结果中选择正确的 model ID。

2b. ModelScope model ID → 用 API 获取真实标签

curl -sL "https://modelscope.cn/api/v1/models/MODEL_ID" | python3 -c "
import sys, json
d = json.load(sys.stdin).get('Data', {})
tasks = d.get('Tasks', [])
result = {
    'pipeline_tag': tasks[0].get('Name', '') if tasks else '',
    'tags': d.get('Tags', []),
    'library_name': d.get('Libraries', [''])[0] if d.get('Libraries') else '',
    'license': d.get('License', ''),
    'model_type': d.get('ModelType', [''])[0] if d.get('ModelType') else '',
}
print(json.dumps(result, indent=2, ensure_ascii=False))
"

ModelScope API 字段映射：Tasks[0].Name → pipeline_tag，Tags → tags，License 是可直接使用的许可证文本。

2c. 本地路径 → 优先从 HuggingFace API 获取真实标签

即使模型在本地，也应优先查询 HuggingFace 上的真实标签，而不是从 config.json 的 model_type 推断。

第一步：从本地路径推断 HuggingFace model ID

如果本地路径是 HuggingFace 缓存目录（包含 models--org--model 格式），提取 model ID：

MODEL_PATH="/path/to/model"
# 尝试从缓存路径提取 HF model ID
echo "$MODEL_PATH" | python3 -c "
import sys, re
path = sys.stdin.read().strip()
m = re.search(r'models--([^-]+)--(.+?)(?:/snapshots|/blobs|$)', path)
if m:
    print(f'{m.group(1)}/{m.group(2)}')
"

如果提取成功，用提取到的 model ID 走 步骤 2a 的 HF API 流程获取标签。

第二步：无法提取 model ID 时，用 config 获取基本信息（但 tags 仍需确认）

如果第一步无法提取 model ID，读取 config.json 获取 model_type、architectures 等基本信息：

python3 -c "from transformers import AutoConfig; print('ok')" 2>&1 || pip3 install transformers --quiet

python3 << 'PYEOF'
import json, os

MODEL_PATH = "MODEL_PATH"

from transformers import AutoConfig
config = AutoConfig.from_pretrained(MODEL_PATH, trust_remote_code=True)

result = {
    "model_type": config.model_type,
    "pipeline_tag": "",  # 步骤3中根据映射表推断
    "tags": [],  # 不要用 model_type 填充——tags 应该是 HF 平台标签
    "library_name": "transformers",
    "license": "",
    "architectures": getattr(config, 'architectures', None) or [],
}

print(json.dumps(result, indent=2, ensure_ascii=False))
PYEOF

然后询问用户该模型在 HuggingFace 上的 model ID，用 API 获取真实 tags。如果模型不在 HuggingFace 上，才使用步骤 3 的映射表手动构造 tags。

2d. 无论哪种方式，都需要读取模型 config（用于步骤5的 README 生成）

如果模型路径是 HF model ID 且本地没有缓存，只下载配置文件（不下载权重）：

python3 -c "
import os
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'
from huggingface_hub import snapshot_download
snapshot_download('MODEL_ID', allow_patterns=['config.json', '*.md', 'tokenizer_config.json', 'preprocessor_config.json'], local_dir='/tmp/model-temp')
"

然后用 /tmp/model-temp 的 config.json 补充模型信息。

3. 映射 pipeline_tag（仅本地路径需要）

如果已从 API 获取了 pipeline_tag，跳过此步骤。

读取 references/pipeline_tags.md 中的映射表，根据 model_type 找到对应的 pipeline_tag。

如果 model_type 在映射表中找不到，按以下优先级推断：

model_type 包含 vl → image-text-to-text
model_type 包含 audio/speech → automatic-speech-recognition
model_type 属于编码器模型（bert/roberta/deberta/electra）→ fill-mask
都不匹配 → 询问用户手动指定

映射完成后，仅确定 pipeline_tag。tags 字段应从 HuggingFace API 获取（包含平台自动标签如 transformers、pytorch、safetensors 以及 pipeline_tag 对应的任务标签等），不要用 model_type 或 architectures 填充 tags。

4. 展示并确认标签

将推断结果展示给用户。用表格形式：

| 字段 | 值 |
|------|-----|
| library_name | transformers |
| pipeline_tag | image-text-to-text |
| tags | model-agent-tagged, transformers, image-text-to-text, pytorch, safetensors |
| license | apache-2.0 |

让用户确认或修改。用户可以：

直接确认，继续下一步
修改某个字段的值
添加额外字段（如 license_name、datasets、metrics 等）

5. 智能合并 README frontmatter

读取步骤1中自动搜索到的 README.md 文件（注意：不是模型路径下的 README，而是步骤1中搜索到的 README 路径）：

如果 README 不存在：创建一个只有 YAML frontmatter 的新文件。

如果 README 存在但没有 YAML frontmatter（不以 --- 开头）：在文件最开头插入 frontmatter。

如果 README 已有 YAML frontmatter：智能合并——保留用户手动添加的字段（如自定义 license_name），只更新自动推断的字段值。判断依据：

自动推断的字段（library_name、pipeline_tag、tags）用新值覆盖
如果用户已手动设置 license，保留用户的值
用户自定义的字段（不在自动推断列表中的）原样保留

最终写入的格式：

---
tags:
- model-agent-tagged
- transformers
- image-text-to-text
- pytorch
library_name: transformers
pipeline_tag: image-text-to-text
license: apache-2.0
---
[原有 README 内容...]

YAML 格式要求：

tags 用列表格式（每行 - tag-name），写在最前面
其他字段用 key: value 格式
--- 分隔符独占一行
frontmatter 结束后空一行再接正文

6. 创建或关联 GitCode 仓库

询问用户："创建新仓库还是使用已有仓库？"

选项 A：创建新仓库（通过 API）

Token 从环境变量 ATOMGIT_USER_TOKEN 自动读取。如果未设置直接退出。

然后询问：

仓库名称（name）：如 "Qwen2-VL-7B-Instruct"
仓库路径（path）：如 "qwen2-vl-7b-instruct"（默认与 name 相同）
是否私有（private）：默认 false（公开）

调用 API 创建模型仓库：

curl --location 'https://api.gitcode.com/api/v5/user/repos' \
  --header "private-token: $ATOMGIT_USER_TOKEN" \
  --header 'Content-Type: application/json' \
  --data '{
    "name": "<REPO_NAME>",
    "path": "<REPO_PATH>",
    "private": false,
    "repository_type": "model"
  }'

仓库地址直接用 token 构造，无需从 API 返回值提取：

REPO_URL="https://auth:${ATOMGIT_USER_TOKEN}@gitcode.com/<REPO_PATH>.git"

选项 B：使用已有仓库

询问用户仓库路径（如 yanlp/demo1-1），然后同样构造带认证的地址：

REPO_URL="https://auth:${ATOMGIT_USER_TOKEN}@gitcode.com/<路径>.git"

7. 推送到 GitCode

# 初始化 git（在 README 所在目录操作）
cd "$(dirname "$README_PATH")"
git init

# 添加 GitCode 远程仓库（URL 已含 token，无需额外认证）
git remote add origin REPO_URL || git remote set-url origin REPO_URL

# 只提交 README.md
git add README.md
git commit -m "publish: add model card with auto-inferred tags"

# 推送到 GitCode（假设 main 分支）
git push -u origin main

注意事项

固定标签 model-agent-tagged：所有通过本 skill 发布的 README，其 tags 列表中都必须包含 model-agent-tagged。无论标签来源是 HF API、ModelScope API 还是本地推断，在最终写入 frontmatter 前，确保 model-agent-tagged 出现在 tags 列表中。此标签用于标识该模型文档由 Agent 自动打标。
标签来源优先级：平台 API > 本地 config 推断。HF/ModelScope API 返回的是平台上真实使用的标签，比本地推断更准确。
整个过程不接触模型权重文件（.safetensors、.bin、.pt 等），只操作配置文件和 API 查询
如果 tags 中包含 license:xxx 格式的标签，可将其提取为独立的 license 字段
如果用户模型不是 transformers 架构（如 MLX、GGUF），告知用户此 skill 当前只支持 transformers 格式的模型卡
HF API 返回的 tags 包含平台自动标签（transformers、safetensors、pytorch、text-generation 等）和用户自定义标签，应完整保留

gitcode-publish

Invocation

Context Preview

SKILL.md

gitcode-publish

Invocation

Context Preview

SKILL.md

GitCode 模型发布

工作流程

1. 获取模型信息

Agent 自动搜索 README

确定模型路径

1.5. 解析模糊的 HuggingFace 模型 ID

2. 获取模型元数据

2a. HuggingFace model ID → 用 API 获取真实标签

2b. ModelScope model ID → 用 API 获取真实标签

2c. 本地路径 → 优先从 HuggingFace API 获取真实标签

2d. 无论哪种方式，都需要读取模型 config（用于步骤5的 README 生成）

3. 映射 pipeline_tag（仅本地路径需要）

4. 展示并确认标签

5. 智能合并 README frontmatter

6. 创建或关联 GitCode 仓库

选项 A：创建新仓库（通过 API）

选项 B：使用已有仓库

7. 推送到 GitCode

注意事项

Similar Skills

GitCode 模型发布

工作流程

1. 获取模型信息

Agent 自动搜索 README

确定模型路径

1.5. 解析模糊的 HuggingFace 模型 ID

2. 获取模型元数据

2a. HuggingFace model ID → 用 API 获取真实标签

2b. ModelScope model ID → 用 API 获取真实标签

2c. 本地路径 → 优先从 HuggingFace API 获取真实标签

2d. 无论哪种方式，都需要读取模型 config（用于步骤5的 README 生成）

3. 映射 pipeline_tag（仅本地路径需要）

4. 展示并确认标签

5. 智能合并 README frontmatter

6. 创建或关联 GitCode 仓库

选项 A：创建新仓库（通过 API）

选项 B：使用已有仓库

7. 推送到 GitCode

注意事项

Similar Skills