专门用于降低中文学术论文(毕业论文、期刊论文、综述)的 AIGC 检测率。 针对知网、维普、PaperPass 等基于 BERT 语义分类模型的检测器,从语义结构层 深度改写文本,而非简单的词汇替换。当用户提到"降 AI 率""降 AIGC""中文论文 AI 痕迹""知网 AIGC 检测""维普 AI 检测""BERT 检测器""论文被判定 AI" "降 AI 检测率"时使用本技能。
How this skill is triggered — by the user, by Claude, or both
Slash command
/cn-humanizer-academic:cn-humanizer-academicThis skill is limited to the following tools:
The summary Claude sees in its skill listing — used to decide when to auto-load this skill
这些是从真实使用反馈中提炼出来的"红线",**任何改写都不能违反**:
这些是从真实使用反馈中提炼出来的"红线",任何改写都不能违反:
改写后字数 ≤ 原文字数 × 1.2。膨胀超过 20% 视为过度改写。
不要在改写正文里使用任何 markdown 加粗(两个星号包裹)。
严格只用原文已有的 [N] 编号。
[X] 文献引用(X et al. 年份))必须改回原文已有的数字编号研究者口吻 ≠ 日常口语。这些绝对不要用:
| 红线词(过于口语) | 替换 |
|---|---|
| 一直在涨 | 持续扩大 / 持续增长 |
| 跟着上来了 | 同步上升 |
| 越铺越多 | 快速铺开 |
| 麻烦的地方在于 | 值得注意的是 |
| 几乎看不出来 | 通常具有隐蔽性 |
| 一点点往下走 | 逐步下降 |
| 如果不管 | 一旦不加干预 |
| 不太够用 | 不足比较明显 |
| 基本无能为力 | 基本难以识别 |
学术允许的研究者口吻(可用):
不要给每段都加引号修辞 / 破折号 / 研究者口吻——这会形成新的"另一种 AI 风格",反而被 BERT 抓到。
| 工具 | 每段使用上限 |
|---|---|
| 引号修辞(包裹概念) | 0-2 处 |
| 破折号(——补充展开) | 0-2 处 |
| 反问句 | 全文偶尔 1-2 处 |
| 类比 / 比喻 | 全文偶尔 1-2 处 |
核心原则:研究者写论文,大部分时候是平淡陈述,只在关键处用修辞。AI 反而会"每段都精致"——这是 AI 的另一种指纹。
如果需要加入"具体细节",这些细节必须满足:
原文 1 段最多拆到 3-4 段。拆超过 5 段是过度,会:
当前主流中文 AIGC 检测器(知网 4.0+、维普、PaperPass)已经从第一代统计学方法(困惑度、突发性、词频)升级到第二代 BERT 语义分类模型。
第一代检测器抓的是:
→ 用 Humanizer-zh 的词汇替换就能解决。
第二代 BERT 检测器抓的是:
→ 这些只能通过语义层重写,改词汇没用。
所以这个 skill 的核心,不是替换词,而是重构段落的论述方式——但必须在上面 7 条硬性约束内进行。
不同类型段落需要不同策略:
| 段落类型 | 典型特征 | 是否高危 |
|---|---|---|
| 分类陈列段 | 用"一类...另一类...还有一类"或"首先...其次..."分点列举 | 🔴 极高危 |
| 原理介绍段 | "X 是一种 Y 方法,基本思路是...,因此能..." | 🔴 极高危 |
| 总结段(章末小结) | "本章围绕...,首先...,随后...,综合来看..." | 🔴 极高危 |
| 文献综述段 | 多个 [N] 引用并列陈列,每个工作介绍长度相近 | 🟠 高危 |
| 现象描述段 | 列举多个客观现象,无主观判断 | 🟠 高危 |
| 数据/技术细节段 | 包含具体数字、设备型号、参数 | 🟢 较安全 |
做法:
约束提醒:拆分不超过 4 段,总字数不超过原文 × 1.2。
做法:
约束提醒:破折号每段 0-2 处,不要泛滥。
做法:遇到抽象动词("影响""作用""导致""体现""反映"),问自己"具体怎么影响/作用?"然后用具体描述替代。
约束提醒:具体细节必须是领域常识,不能凭空捏造。
做法:
约束提醒:研究者口吻不等于口语化,严格遵守约束 4。
必删 / 必换的 AI 高频词:
| 类别 | AI 词 | 替换 |
|---|---|---|
| 连接 | 此外、然而、因此、与此同时、综合来看 | 删除或换"不过/所以/整体上" |
| 排比 | 一方面...另一方面... | 既...也...;一是...二是... |
| 排比 | 首先...其次...再次...最后... | 一是...二是...三是...或具体短标题 |
| 套话 | 对于...而言、值得注意的是 | 删"于/而言";适度保留"值得一提的是" |
| 动词 | 进行了 + N | 做了/完成了/给出了(混用) |
| 动词 | 通过 + N | 借助/利用/依靠(混用) |
| 文言 | 使、将、若、其、该 | 让、把、如果、它、这个/这种(适度) |
| 副词 | 显著、均、上述、能够 | 明显、都、这些/以上、能 |
| 总结 | 这说明、表明、从而、以提高 | 说明、显示、(删)、用来 |
| 强调 | 至关重要、关键作用、深入探讨 | 一律删除或改具体表述 |
约束检查(硬性):
□ 改写后字数 ≤ 原文 × 1.2?(超出立即压缩)
□ 没有使用任何 markdown 加粗?
□ 没有新增参考文献?
□ 没有出现"红线词"(一直在涨/麻烦的地方等)?
□ 修辞工具使用频率符合上限?(引号 0-2/段,破折号 0-2/段)
□ 补充内容都是领域常识?
□ 段落拆分 ≤ 4 段?
段落级检查:
□ 段落内不同分点/论述的篇幅有明显不均衡吗?
□ 段落避免了"总分总"完美结构吗?
□ 句子之间没有过度流畅的因果链吗?
□ 至少有一处"研究者口吻"或"具体观察"吗?
词汇级检查:
□ 是否还有"首先...其次...再次"/"一方面...另一方面"?
□ 是否还有"此外""综合来看""值得注意的是""相比之下"?
□ "进行了"是否还在大量出现?
□ "通过"是否还是主要连接词?
节奏检查:
□ 句子长度有明显变化?(连续 5 句都是 30+ 字 = AI)
□ 是否有 1-2 处"超短句"(10 字以内)?
□ 段首词是否错开?(连续段落用相同起手词 = AI)
对每一段重写,按以下格式输出:
诊断:[识别段落类型 + 主要 AI 痕迹]
重写后:
[改写后的文字]
字数对比:
原文 X 字 → 改写后 Y 字(变化 +Z%)
关键改动:
- 改动 1:[原文片段] → [改写片段] | 应用策略 [A/B/C/D/E]
- 改动 2:[原文片段] → [改写片段] | 应用策略 [A/B/C/D/E]
- ...
自检结果:
□ 字数 ≤ 原文 × 1.2 ✓ / ✗
□ 无加粗 ✓ / ✗
□ 无新增引用 ✓ / ✗
□ 无红线口语词 ✓ / ✗
□ 修辞工具适度 ✓ / ✗
□ 段落数 ≤ 4 ✓ / ✗
□ 段落不均衡 ✓ / ✗
□ 破坏 AI 流畅链 ✓ / ✗
□ 包含具体细节 ✓ / ✗
□ 有研究者口吻 ✓ / ✗
□ AI 高频词清扫 ✓ / ✗
如果一段反复改还是被 BERT 识别,且不能违反硬性约束,试这些:
把段落内 3-4 个论点的顺序完全打乱,然后重新组织过渡。 AI 写作的论点顺序极其"标准"(背景→问题→方法→结果),打乱顺序后 BERT 模板匹配失效。这种方法不增加字数,符合约束 1。
原来是 "X 方法 → 优点 1, 优点 2, 缺点 1" 的正向论证。 改成 "X 方法 → 缺点 1 → 但有 优点 1 → 也有 优点 2" 的迂回论证。 字数不变,符合约束 1。
AI 几乎不会用问句。全文偶尔 1-2 处即可,不能多。
最高级的手段,不增加字数,只改变句式结构:
为了提高模型在复杂环境 EL 图像上的稳定性,本文在网络训练阶段引入互蒸馏协同学习机制。和传统教师—学生蒸馏不同,该方法不预先设定一个固定的强教师模型,而是构建两个结构相同但参数初始化不同的同伴网络,让它们在同一训练过程中相互提供监督信息。这样处理的考虑在于,让两个网络在共享类别标签约束的同时,保留各自对输入样本的不同判断,形成互补的特征表达。对低质量 EL 图像来说,这种协同训练方式能减轻单一网络对局部噪声、模糊和亮度扰动的敏感性,让模型在复杂环境下获得更稳定的判别边界。
互蒸馏的基本机制在 2.5.2 节已经讨论过,这里关注它在 SCRViT 训练流程里的具体落地。
选互蒸馏而不是传统蒸馏,主要是因为本任务找不到一个真正稳定的"强教师"——一个在清晰图像上表现好的大模型,放到低质量 EL 样本上判断未必可靠,教师不稳,学生模仿过来的就是带偏差的判别边界。互蒸馏绕开了这一前提。本文在训练阶段构造两个结构相同、初始化不同的 SCRViT 网络并行训练,每个网络一边用真实标签做分类,一边把对方的预测分布作为额外监督信号。两路从不同初始化出发,看到的决策边界会略有差异,这种差异在互相对齐的过程中被反复修正。
对低质量 EL 图像而言,这种机制相当于在标签监督之外多了一层"同伴交叉验证",对噪声、模糊、亮度漂移这类样本扰动的稳健性会更好一些。
字数变化:220 → 270(+23%,略微超出 +20% 上限,但 3 段结构合理,可接受)
关键改动:
从真实改写过程中提炼的额外经验:
一段改得很"人"但其他段没改,整篇论文就会出现风格断层——BERT 对断层敏感。 解决:全文按统一改写强度处理,不要某段大改、某段不动。
如果连续几段都用"破折号补充 + 引号修辞 + 研究者口吻",就形成了新的 AI 指纹。 解决:让不同段使用不同的反 AI 手段——这段用 A 策略为主,下段用 B 策略为主。
AI 写每段都是独立处理的,研究者会在不同章节之间建立逻辑链。 解决:在合适的位置加"前面在 X 节已经..."这类回扣句(每章 1-2 处即可)。
私货(具体实验经历、导师讨论、个人观察)是降 AI 痕迹的最强武器,但只能由用户自己加。 Skill 能做的是"基于已有内容做结构重写",不能凭空创造研究细节。
Creates, edits, and optimizes skills for Claude Code, including drafting, evaluating with test prompts, iterating on performance, and improving skill descriptions for better triggering accuracy.
npx claudepluginhub ranranrannervous/cn-humanizer-academic --plugin cn-humanizer-academic