From light
Generates novel, differentiated research ideas grounded in project context, data feasibility, and literature gaps. Use when needing innovation points, research directions, or evaluating what a dataset can do.
How this skill is triggered — by the user, by Claude, or both
Slash command
/light:light-idea-generationThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
开工前确认两件事:(1) m01 的文献 gap 是否清楚;(2) m02 的数据是否足以支撑——**读 m02 的 `data_feasibility.md`(四问结论卡,标准交接工件)**:verdict=INSUFFICIENT 则先回 m02 补采/补质,不做空想 idea;USABLE_WITH_CAVEATS 则把其 warn 项作为 idea 必须正视的约束。无该卡时要求 m02 先产出,不靠口头"数据应该够"。
开工前确认两件事:(1) m01 的文献 gap 是否清楚;(2) m02 的数据是否足以支撑——读 m02 的 data_feasibility.md(四问结论卡,标准交接工件):verdict=INSUFFICIENT 则先回 m02 补采/补质,不做空想 idea;USABLE_WITH_CAVEATS 则把其 warn 项作为 idea 必须正视的约束。无该卡时要求 m02 先产出,不靠口头"数据应该够"。
项目背景、已有基础、数据条件、技术栈与算力、时间周期、目标(顶刊/普刊/竞赛/课题/工程)、约束。
先判断输入属于哪一级(借 AI-Researcher 的两级抽象):
idea_candidates.md。data_type(信本地事实)找别人没用过的数据角度;已知偏倚(bias_risk)须按 domain_scope= 子串过滤后再用——别把某方向的偏差判断(如"ImageNet 西方中心")误当成你方向的通用机会/障碍;许可用 db04 的 dataset_signal.py(在 databases/db04-datasets/scripts/)实时校验值判可行性,不信可能过期的本地快照。不够发散时,补用 7 个结构化激发技法(源自 Scientific Brainstorming):跨域类比、假设反转("反过来会怎样/资源无限会怎样")、尺度切换(分子↔种群、毫秒↔千年)、约束增删、跨学科融合、技术外推(新技术来了能做什么)。method-transfer/combination 角度可仿 ResearchAgent:先抽取本项目领域核心实体,再找与之高共现的邻域概念作为迁移/重组来源;MAGenIdeas 证明这种跨域知识重组 + 迭代检索能把唯一新颖 idea 数提到约 3.4 倍。
突破口的最大杀手是在一条思路上死磕(frame-lock)。两步把发散面强制撑开:
python scripts/provocation_gen.py --seed "实体1,实体2,实体3"——抽取本项目 2~4 个核心实体,用结构化激发算子(空白直击/技术外推/尺度切换/假设反转/失效驱动/约束增删 + 实体两两跨域强配)机械生成发散提问单,覆盖全部 7 角度。逐条带项目背景作答,每条至少逼出 1 个候选。提问是脚手架不是 idea 本身——洞察靠你 + 文献 + 底座模型,本脚本只保证你没在单一思路上死锁。angle 标签的 candidates.json 后,python scripts/provocation_gen.py --coverage candidates.json 机检:总量 <15 或某角度 0 候选即判 frame-lock 风险、拦在收敛前(退出码 1),逼你回去补缺失角度,别拿单一思路凑数往下走。某角度占比 >60% 也告警偏科。数量漏斗:先发散到 ≥15 条原始候选(少于此说明发散不够,回上面补技法),再经下列收敛到 3–6 条送 m04——漏斗入口宽、出口窄才能拉开差距。
domain_scope= 过滤,别把某领域的时间线判断误用到别的方向。python scripts/candidate_dedup.py --in candidates.json——两两算相似度(默认零依赖文本相似度,可传 --emb 用 SPECTER2 余弦升级),按批内 mean+1σ 自动标"疑似变体对",把含糊的"显著高于其余"变成可执行判定,合并换皮候选。候选 JSON 字段格式见 examples/candidates.example.json(每条带 id/title/claim/angle/impact/effort/novelty/feasibility,一份样例同时喂 dedup/rank/provocation 三脚本,接上"立项卡 md → 候选 json"的手工整理断点)。python scripts/rank_ideas.py --in candidates.json --top-k 6——分层组合裁定:先把候选分到 moonshot(冲刺/高风险高回报)/solid(稳妥)/safe(保底) 三道,每道各自合理排序(moonshot 按影响→新颖,不用性价比;solid 才用影响/工作量性价比;safe 按可行+省力),再 round-robin 三层交替组合 shortlist。关键:突破口(高影响必然高工作量)不被性价比压杀——若用单一性价比榜,moonshot 会系统性输给保底项,与下面"分层产出"自相矛盾。rank_ideas.py 的分层组合裁定做收敛漏斗主排序键(决定送 m04 的分层结构与顺序);③ 五维(1–5) 做交 m04 前终检(每维分低的回炉)。最终送审结构与顺序以 ② 为唯一裁定——它本身已是分层的,故"按潜力分层产出"与"唯一排序键"不再冲突。提"创新点/相对哪些工作"前,实际检索对标工作,避免"自以为新"和引用幻觉。检索统一调 m01(light-literature-search) 已验证脚本,不手拼 API URL(手拼 URL 易踩限流/分页/编码坑,且与 m01 真相源割裂):
python light-literature-search/scripts/search_normalize.py:多源检索并规范化,首轮即带后向引用边(OpenAlex / Crossref)——用核心机制关键词初筛对标工作。python light-literature-search/scripts/snowball.py:对最像的一两篇做前向被引 + 后向参考"滚雪球",把最近邻工作捞全。python light-literature-search/scripts/cross_domain_search.py:为 method-transfer 型 idea(见上"发散策略"第 2 条)专用——应用轴×方法轴正交检索,方法轴强时效抓别领域最新 SOTA,输出"迁移提示"列出可嫁接到本课题的前沿方法。用于正向发现"哪些别领域方法能搬过来"(区别于上面两脚本的"反向核验已有撞车");可迁移性仍须研究者据方法假设在本数据/任务是否成立判断,不被脚本提示直接采信。检索结论决定"创新点"措辞:若已有高度相似工作,回到发散重选角度,别硬说新。
embedding.specter_v2 768 维向量算余弦)。SPECTER2 余弦整体偏高(实测 0.85~0.93),按相对差判定:一批候选里相似度显著高于其余对的,视为同一 idea 的变体,合并或重发散,别当独立候选凑数。无 embedding 时降级标题/摘要文本相似度。血泪教训:曾把一个"重采样破坏概率校准"的 idea 评到新颖性≈70,做完整套实验、写完论文后才检索到 Dal Pozzolo 2015 已专门做过同一核心,新颖性实为 35-45——核心结论被前人发表过,投稿必被一句"已做过"拒掉。为根除此类"做完才发现撞车",提 idea 时必须回答下面四问,任一答错即打回重选方向,不准跳过、不准用"应该没人做"搪塞:
把这四问的检索证据(关键词、库、HTTP 码、最像 3 篇、量化 delta)写进立项卡,直接交给 m04 复核——m04 会重查核心撞车,查出 idea 自报与实际不符即记红旗封顶。
用 ResearchAgent 五维 + AI Scientist 三维快评每个 idea,分低的回炉:
python scripts/card_gate.py --in idea_candidates.md 校验每张卡的硬条件——(m04复核) 字段非空且非敷衍占位、最近邻 ≥3 篇带检索留痕、新颖性归档三档、撞车自评选档、无模糊词支撑复核字段。残卡(空字段/最近邻<3/未归档)会被拦下;填"无/更好/有数据"等敷衍占位冒充内容、或最近邻列填"无"假装查过,也一并拦下(审查实测过这个洞),把"自报不被采信"做成可机检而非靠自觉。门禁只校验结构完整性,不判 idea 优劣(那是 m04 的事)。填写参照黄金样例 examples/idea_candidates.example.md(2 张分层卡,含撞车四问留痕/最像3篇/量化 delta 的合格写法)。3–6 个分层 idea(moonshot 冲刺/高风险高回报 · solid 稳妥 · safe 保底),由 rank_ideas.py 分层组合裁定给出送审结构(非单一性价比榜,突破口不被压杀),附对比表。每个标注所在道、潜力分(影响+新颖)、成熟度与差异化强度,并带上自检的五维/三维分。标准工件:idea_candidates.md(交 m04 的交接工件,命名见 CONVENTIONS §6.1)。
所有 idea 必须送 m04 idea-critique 严审。被毙的 idea 带着 m04 给的方向回到本技能再生成,形成循环。通过的 idea 才进 m05。写入项目库 db09 的 decision_log。
方法来源与真实端点/评审维度的逐工具笔记见 references.md。
npx claudepluginhub light0305/light-skillsCritiques research ideas using top-conference reviewer standards with blind evaluation, multi-dimension scoring, retrieval verification, and anti-sycophancy protocols.
Orchestrates brainstormer, idea-critic, and research-strategist agents through 6-phase pipeline (Seed → Diverge → Evaluate → Deepen → Frame → Decide) for research ideation, evaluation, and decision-making. Triggers on brainstorming research or project triage.
Generates novel research ideas through open-ended brainstorming, interdisciplinary connections, and assumption challenging. Useful for early-stage research planning.