Skill

llm-infra-recruiter

专为筛选大模型基础设施（LLM Infra）工程师简历设计。当用户需要评估国产算力方向的大模型训练/推理 Infra 候选人时使用此 skill。重点评估候选人在国产算力算子开发、分布式并行训练、RL 工程落地及性能分析等方向的经验，生成包含多维度评分、评分理由和潜在疑点的结构化评估报告。适用场景：用户上传简历文件（PDF/Word/文本）并要求筛选或评估大模型 Infra 候选人。

Invocation

How this skill is triggered — by the user, by Claude, or both

Slash command

/cmq-work-skills:llm-infra-recruiter

User invocable

Model invocable

Inline context

Default effort

Context Preview

The summary Claude sees in its skill listing — used to decide when to auto-load this skill

按以下步骤依次执行，不得跳过：

Supporting Files

llm_infra_engineer_jd.md

SKILL.md

166 lines · ~1.1k tokens

Stats

Stars0

MaintenanceExcellent

Last CommitMar 31, 2026

Actions

View Source View Plugin View on GitHub View README

Stats

Actions

大模型 Infra 工程师简历筛选 Skill

工作流程

按以下步骤依次执行，不得跳过：

解析简历：务必将简历附件转换为 Markdown 格式后，再进行后续分析。若为 PDF 格式，优先使用 shell 工具执行 pdftotext <path> - 提取文本；若 pdftotext 输出质量差（如乱码、内容缺失），则改用 file 工具的 view 功能进行多模态识别。将提取的内容整理为结构化文本后再进行后续分析。
执行评估：严格按照下方"评分标准"和"疑点检测"规则，对简历内容进行逐维度分析，给出初步评分。
交叉验证：对照原始 JD 要求（核心职责、任职要求、加分项），审查各维度评分的合理性：
- 检查是否存在简历亮点被低估（如 JD 明确要求"国产算力算子开发"或"HCCL/HCCS 调优"经验，但评分未充分体现）
- 检查是否存在简历短板被忽视（如 JD 要求"昇腾/沐曦/摩尔线程"实际开发经验，但候选人仅有 CUDA 经验）
- 检查加分项匹配度（如候选人具备 verl/slime/vllm 等 JD 明确提及的框架贡献，是否在评分中体现）
- 如有偏差，调整相应维度得分并说明调整理由
生成报告：严格按照下方"输出格式"生成最终的 Markdown 评估报告，并直接呈现给用户。

岗位背景

本 skill 针对以下类型的大模型 Infra 工程师岗位设计：

原始 JD 文件：llm_infra_engineer_jd.md

核心职责

基于 TBE、Ascend C、tielang 等工具开发算子，优化 Attention、MoE 等核心算子性能；
优化国产集群下的数据/张量/流水线/专家并行策略，优化通信瓶颈，改造训练框架；
完成强化学习全链路在平台的工程化实现与效率优化；
使用 msprof 等工具定位性能瓶颈，优化计算与通信重叠，诊断集群故障。

核心门槛：候选人必须具备昇腾（Ascend）、沐曦、摩尔线程等国产算力的实际开发经验。不具备此经验的候选人，无论其他维度多强，均应在综合评价中明确标注为"不满足硬性要求"。

评分标准

共五个维度，每个维度独立打分（1–5 分），最终按权重计算综合得分（满分 100 分）。

维度一：国产算力算子开发（权重 35%）

考察候选人在国产 AI 芯片（昇腾/沐曦/摩尔线程等）上的算子开发与优化经验，这是本岗位的硬性门槛。

分数	标准
5	有在国产算力上使用 TBE、Ascend C、tielang 等工具开发并上线核心算子（如 Attention、MoE、Flash Attention 变体等）的完整经验，能描述性能优化的具体手段和量化收益。
4	有在国产算力上开发算子的实际经验，能独立完成算子适配与调优，但涉及的算子类型或优化深度相对有限。
3	有在国产算力上使用相关工具的经验，但主要以适配已有算子为主，未涉及从零开发或深度性能优化。
2	有 CUDA 算子开发经验，但国产算力经验仅停留在环境搭建或简单调用层面，未涉及算子开发。
1	无国产算力实际开发经验，或简历中完全未提及相关内容。

注意：维度一得分为 1 分时，必须在"潜在疑点"和"综合评价"中明确标注候选人不满足岗位硬性要求。

维度二：分布式并行训练与通信优化（权重 30%）

考察候选人在大规模分布式训练框架（Megatron-LM、DeepSpeed 等）及国产通信库（HCCL、HCCS）上的实践经验，以及对并行策略（数据/张量/流水线/专家并行）的掌握深度。

分数	标准
5	深入参与过大规模模型（百亿参数以上）的分布式训练，主导过并行策略的设计与调优；有 HCCL/HCCS 实际调优经验，能定位并解决通信瓶颈，有量化的性能提升数据。
4	熟悉 Megatron/DeepSpeed 等框架，在生产环境中参与过分布式训练任务；了解 HCCL/HCCS 并有使用经验，能独立分析通信瓶颈。
3	了解分布式训练的基本原理和常见并行策略，有过使用 Megatron/DeepSpeed 的经历，但未涉及深度调优或大规模场景。
2	对分布式训练有概念性了解，有过单机多卡训练经验，但未涉及多机多卡或通信优化。
1	无分布式训练实际经验。

维度三：性能分析与故障诊断（权重 15%）

考察候选人使用性能分析工具（msprof、nsight、vtune 等）定位性能瓶颈、优化计算与通信重叠、诊断集群故障的能力。

分数	标准
5	熟练使用 msprof 或同类工具进行系统级性能分析，有完整的"发现瓶颈→定位根因→优化验证"闭环经验，能描述具体的优化手段（如 kernel fusion、计算通信 overlap）和量化收益。
4	能使用性能分析工具定位常见瓶颈，有实际优化经验，但优化深度或系统性不足。
3	了解性能分析工具的基本使用方法，有过简单的性能调优经历。
2	对性能分析有概念性了解，但无实际工具使用经验。
1	简历中未体现性能分析与故障诊断相关经验。

维度四：工程基础与系统能力（权重 10%）

考察候选人的 C++/Python 工程基础、计算机体系结构知识，以及从 0 到 1 构建或改造复杂系统的能力。

分数	标准
5	C++/Python 功底扎实，有深入理解计算机体系结构（存储层次、指令流水、内存模型等）的项目经历；有主导改造大型训练框架或基础设施的经验。
4	C++/Python 基础良好，有在复杂系统中进行模块级开发或改造的经验，对体系结构有一定理解。
3	有 C++/Python 开发经验，能完成功能模块的开发，但缺乏系统级设计或体系结构深度。
2	以 Python 为主，C++ 经验有限，缺乏底层系统开发经验。
1	工程基础薄弱，缺乏 C++/Python 实际项目经验。

维度五：加分项（权重 10%）

考察候选人是否具备 JD 中提及的加分项：强化学习工程落地经验、主流框架（vllm/sglang/megatron/verl/slime 等）贡献者身份，或百亿以上参数模型的实际训练经验。

分数	标准
5	具备两项及以上加分项，且均有实际落地或贡献记录（如可查的 PR/commit 记录、具体模型规模数据）。
4	具备一项加分项，且有明确的实际落地或贡献记录。
3	具备一项加分项，但证据不够充分（如仅提及框架名称，无具体贡献细节）。
2	与加分项方向有一定关联，但未直接涉及（如有小规模 RL 实验经验，但未工程化落地）。
1	不具备任何加分项相关经验。

综合得分计算

综合得分 = (D1×35 + D2×30 + D3×15 + D4×10 + D5×10) / 5

其中 D1–D5 分别为五个维度的得分（1–5 分），最终结果为满分 100 分的综合得分。

疑点检测

在评分完成后，必须对简历进行以下专项检查。若发现疑点，在报告中逐条列出；若无疑点，明确写出"未发现明显疑点"。

硬性门槛缺失：若候选人无任何国产算力（昇腾/沐曦/摩尔线程等）实际开发经验，必须在此处明确标注。
时间线重叠：检查所有工作经历和项目经历的起止时间，若存在同一时段出现两段全职工作或两个全时投入项目的情况，标注出具体的重叠时间段和涉及的公司/项目名称。
技能与项目不匹配：若技能列表中声称"精通"或"熟练掌握"的技术（如特定国产芯片工具链），在所有项目描述中完全没有体现，则标注出该技术名称。
描述自相矛盾：若简历中存在前后矛盾的表述（如声称参与百亿模型训练但工作年限明显不足，或声称精通某框架但无相关项目），标注出具体位置和矛盾内容。
经历断层：若工作经历中存在超过 6 个月的空白期且未作说明，标注出该时间段。

输出格式

最终报告必须严格遵循以下 Markdown 格式输出：

## 简历评估报告：[候选人姓名]

> **岗位**：大模型 Infra 工程师（国产算力方向）
> **综合得分：[X.X] / 100**

---

### 维度评分详情

| 维度 | 权重 | 得分（1-5） | 加权分 | 评分理由 |
| :--- | :--- | :---: | :---: | :--- |
| 国产算力算子开发 | 35% | [分数] | [加权分] | [基于简历原文的具体依据] |
| 分布式并行训练与通信优化 | 30% | [分数] | [加权分] | [基于简历原文的具体依据] |
| 性能分析与故障诊断 | 15% | [分数] | [加权分] | [基于简历原文的具体依据] |
| 工程基础与系统能力 | 10% | [分数] | [加权分] | [基于简历原文的具体依据] |
| 加分项 | 10% | [分数] | [加权分] | [基于简历原文的具体依据] |
| **综合得分** | 100% | — | **[总分]** | — |

---

### 潜在疑点

- **[疑点类型]**：[具体描述，引用简历中的原始信息]
- 若无疑点：未发现明显疑点。

---

### 综合评价

[2–3 段文字，概述候选人的核心优势、明显短板，以及是否建议进入下一轮面试，并给出理由。若候选人不满足国产算力硬性门槛，必须在此处明确说明。]

llm-infra-recruiter

Invocation

Context Preview

Supporting Files

SKILL.md

llm-infra-recruiter

Invocation

Context Preview

Supporting Files

SKILL.md

大模型 Infra 工程师简历筛选 Skill

工作流程

岗位背景

核心职责

评分标准

维度一：国产算力算子开发（权重 35%）

维度二：分布式并行训练与通信优化（权重 30%）

维度三：性能分析与故障诊断（权重 15%）

维度四：工程基础与系统能力（权重 10%）

维度五：加分项（权重 10%）

综合得分计算

疑点检测

输出格式

Similar Skills

大模型 Infra 工程师简历筛选 Skill

工作流程

岗位背景

核心职责

评分标准

维度一：国产算力算子开发（权重 35%）

维度二：分布式并行训练与通信优化（权重 30%）

维度三：性能分析与故障诊断（权重 15%）

维度四：工程基础与系统能力（权重 10%）

维度五：加分项（权重 10%）

综合得分计算

疑点检测

输出格式

Similar Skills