面向 GPT Image 2 的圖像生成 / 編輯技能。可在 3 種環境下使用:(A) Garden 本地模式,通過 OpenAI 兼容接口直接出圖並落盤;(B) Host-Native 模式,把本 Skill 當作提示詞工程指引,把渲染好的 prompt 交給宿主 Agent 自帶的圖像工具出圖;(C) Advisor 模式,宿主無任何圖像工具時退化爲高質量 prompt 顧問。涵蓋 18 大類、80+ 個結構化模板,覆蓋海報 / UI / 產品 / 信息圖 / 學術圖 / 技術架構圖 / 漫畫 / 頭像 / 流程板 / 電影分鏡 / IP 周邊 / 編輯工作流等場景。
How this skill is triggered — by the user, by Claude, or both
Slash command
/image-generation-skills:gpt-image-2The summary Claude sees in its skill listing — used to decide when to auto-load this skill
這是一個面向 GPT Image 2 的聚焦型技能,在 3 種運行環境下都能用,但行爲差異顯著。**第一步必須先確定當前運行模式**。
README.mdREADME.zh-CN.mdmanifest.jsonreferences/academic-figures/graphical-abstract.mdreferences/academic-figures/mechanism-diagram.mdreferences/academic-figures/method-pipeline-overview.mdreferences/academic-figures/multi-condition-comparison.mdreferences/academic-figures/neural-network-architecture.mdreferences/academic-figures/publication-chart.mdreferences/academic-figures/qualitative-comparison-grid.mdreferences/academic-figures/research-overview-poster.mdreferences/academic-figures/scientific-schematic.mdreferences/assets-and-props/game-screenshot-mockup.mdreferences/assets-and-props/retro-skeuomorphic-icons.mdreferences/avatars-and-profile/character-grid-portrait.mdreferences/avatars-and-profile/cultural-portrait-series.mdreferences/avatars-and-profile/sticker-set.mdreferences/avatars-and-profile/style-transfer-selfie.mdreferences/avatars-and-profile/themed-3d-icon.mdreferences/branding-and-packaging/beverage-label-design.md這是一個面向 GPT Image 2 的聚焦型技能,在 3 種運行環境下都能用,但行爲差異顯著。第一步必須先確定當前運行模式。
它只做兩類圖像任務:
POST /images/generationsPOST /images/edits本文件保留:運行模式、技能結構、環境變量、保存 / 命名規則、模板索引、模式感知工作流。詳細模板全部放在 references/,分層組織:
本 Skill 自帶一個輕量探測腳本,先跑一次,再根據結果決定怎麼幹活:
node skills/gpt-image-2/scripts/check-mode.js
# 想拿結構化結果給上層程序用:
node skills/gpt-image-2/scripts/check-mode.js --json
輸出會給出 mode = A / A? / B-or-C 以及 recommendation。三個模式定義如下:
觸發條件:環境變量 ENABLE_GARDEN_IMAGEGEN 爲真(1 / true / yes / on)且 存在 OPENAI_API_KEY。
行爲:完整端到端跑通"選模板 → 寫 prompt → 調用腳本 → 出圖落盤"。
scripts/generate.js 文本生圖、scripts/edit.js 編輯現有圖。garden-gpt-image-2/prompt/、圖片落盤到 garden-gpt-image-2/image/。觸發條件:未啓用 Garden(ENABLE_GARDEN_IMAGEGEN 未設置 / 爲假),但當前宿主 Agent 自帶圖像生成工具或圖像 MCP。
典型識別信號(你應該自檢):
image_generation / imagegen / dalle / nano_banana / mcp__*image* / make_image / 類似名字行爲:本 Skill 退化成提示詞工程指引——
node scripts/generate.js(沒有 API key、必失敗)。garden-gpt-image-2/prompt/,但圖片去向由宿主決定,不強制。觸發條件:未啓用 Garden,且宿主 Agent 也沒有任何圖像生成工具。
行爲:本 Skill 退化爲"高質量 prompt 撰寫顧問"——
garden-gpt-image-2/prompt/<task-slug>-<timestamp>.md。| 條件 | 模式 | 調用腳本? | 落盤 prompt? | 落盤圖片? |
|---|---|---|---|---|
ENABLE_GARDEN_IMAGEGEN=1 + 有 KEY | A | ✅ generate.js / edit.js | ✅ 自動 | ✅ 自動 |
ENABLE_GARDEN_IMAGEGEN=1 但沒 KEY | A? | ❌(先要 KEY) | — | — |
| 未啓用 + 宿主有圖像工具 | B | ❌(用宿主工具) | 可選 | 由宿主決定 |
| 未啓用 + 宿主無圖像工具 | C | ❌ | ✅ 必須 | ❌(無法) |
當此技能需要向用戶提問時,遵循以下規則:
scripts/check-mode.js:先跑這個,檢測運行模式(A / B / C)scripts/generate.js:文本生圖(僅 Mode A 使用)scripts/edit.js:基於原圖 / 遮罩改圖(僅 Mode A 使用)scripts/shared.js:共享請求、保存、環境變量讀取邏輯references/:分層結構化提示詞模板(A / B / C 三模式都用)按以下順序讀取配置:
process.env<cwd>/.env<cwd>/.gateway.env~/.gateway.env核心變量:
ENABLE_GARDEN_IMAGEGEN — 模式開關。1 / true / yes / on 時啓用 Mode A;未設置或其它值則進入 Mode B / C。OPENAI_API_KEY — Mode A 必需;B / C 不需要。OPENAI_BASE_URL — 默認 https://api.openai.com/v1,可指向第三方兼容網關。OPENAI_IMAGE_MODEL — 默認 gpt-image-2,可換成網關支持的型號(如 gpt-image-1 / dall-e-3)。默認實現按 OpenAI 兼容接口工作,不寫死任何第三方網關。
如果用戶沒有明確指定輸出路徑,統一使用當前工作區下的:
garden-gpt-image-2/prompt/(A / B / C 三種模式都建議用,方便復用與版本管理)garden-gpt-image-2/image/(僅 Mode A 使用;Mode B 由宿主決定,Mode C 不產生圖)如果目錄不存在,腳本(Mode A)必須自動創建;Mode B / C 在寫 prompt 前手動 mkdir -p。
如果用戶沒有明確指定文件名,腳本應自動生成與當前任務相關的文件名,並追加當前時間戳,避免重名。
命名規則:
garden-gpt-image-2/prompt/<task-slug>-<timestamp>.mdgarden-gpt-image-2/image/<task-slug>-<timestamp>.png其中:
<task-slug>:根據當前用戶要求自動提取一個相關短名稱<timestamp>:當前時間戳,例如 20260424-153045示例:
garden-gpt-image-2/prompt/live-commerce-ui-20260424-153045.mdgarden-gpt-image-2/image/live-commerce-ui-20260424-153045.pnggarden-gpt-image-2/prompt/vr-headset-exploded-view-20260424-153102.mdgarden-gpt-image-2/image/vr-headset-exploded-view-20260424-153102.png| 模式 | 是否必須保存 prompt | 說明 |
|---|---|---|
| Mode A | ✅ 必須 | 進入實際生成 / 編輯流程必落盤 |
| Mode B | 推薦 | 默認建議保存方便復用;用戶說"不用"就略過 |
| Mode C | ✅ 必須 | 用戶拿走 prompt 自己執行,不落盤等於白幹 |
通用規則(適用三種模式):
garden-gpt-image-2/prompt/。--prompt-output,則尊重用戶指定路徑。--image 或 --output,則尊重用戶指定路徑。garden-gpt-image-2/image/。Mode B 由宿主圖像工具決定保存方式;Mode C 不產生圖片。
node skills/gpt-image-2/scripts/check-mode.js
輸出會告訴你當前是 Mode A / B / C,決定後續是否調用 generate.js / edit.js。下面 1~4 僅在 Mode A 下使用。
node skills/gpt-image-2/scripts/generate.js \
--prompt "A cute baby sea otter" \
--size 1024x1024 \
--quality high
node skills/gpt-image-2/scripts/generate.js \
--promptfile garden-gpt-image-2/prompt/poster-20260424-153045.md
node skills/gpt-image-2/scripts/edit.js \
--image assets/source.png \
--prompt "Replace the background with a clean studio scene"
node skills/gpt-image-2/scripts/edit.js \
--image assets/source.png \
--mask assets/mask.png \
--prompt "Replace only the masked area with a glass vase"
沒有命令行入口——本 Skill 此時只是提示詞工程指南:
image_generation 類工具(參數中傳入 prompt)→ 拿到圖。garden-gpt-image-2/prompt/<task-slug>-<timestamp>.md → 把內容直接展示給用戶 → 提示用戶在哪些圖像工具中可以直接復用。當 references/ 中提供 JSON 模板時,按下面規則使用:
SKILL.md 找到最貼近的分類目錄。{argument ...} 表示可替換參數。default 的,默認可以先用默認值。當模板缺少關鍵變量時,不要籠統地問「你想要什麼風格?」。應當根據模板字段精確提問。
例如直播 UI 模板缺少主體時,應優先問:
缺少商品信息時應問:
按任務類型只讀取最貼近的具體模板文件,不要一次性全讀整個 references/。
先讀:
references/prompt-writing.md適用於:
references/ui-mockups/)適合各種「界面 + 內容」的樣機視覺。當前已落地:
live-commerce-ui.md — 電商直播帶貨截圖樣機(主播 + 聊天區 + 禮物區 + 商品卡)social-interface-mockup.md — 社交平臺動態詳情頁樣機(Twitter/X、小紅書、微博、Threads 等)product-card-overlay.md — 落地頁 hero / 詳情頁主圖(人物 + 商品 + 賣點 + 價格)chat-interface-scene.md — 聊天 / 對話界面樣機(iMessage、微信、羣聊、AI 助手)short-video-cover-ui.md — 短視頻封面 / 直播縮略圖(YouTube、抖音、B 站、VTuber stream)landing-page-case-study.md — 深色 SaaS / 營銷 case study 長頁面 UI mockup(多 section + 滾動敘事 + 數據卡 + CTA)references/product-visuals/)適合「以商品爲視覺中心」的圖。當前已落地:
exploded-view-poster.md — 產品爆炸視圖海報(主體垂直堆疊 + callout + 頂部 logo + 底部品牌區)white-background-product.md — 電商純白底主圖(單品 / 多角度 / 極簡營銷疊層)premium-studio-product.md — 高級影棚商業產品圖(雜誌廣告級氛圍)packaging-showcase.md — 禮盒 / 包裝展示圖(外盒 + 內容物展示)lifestyle-product-scene.md — 生活方式產品場景圖(商品出現在真實場景中)ecommerce-marketing-board.md — 中式電商超複合銷售看板(主圖 + 詳情頁 + 賣點 + 使用步驟 + 場景 + TVC 分鏡組合一圖)references/maps/)適合「地圖類視覺」(信息圖已抽離到獨立分類 17)。當前已落地:
food-map.md — 城市美食手繪地圖(編號點位 + 圖例 + 中心吉祥物)travel-route-map.md — 旅行路線圖(多日行程 / 單日 city walk / 戶外路線)illustrated-city-map.md — 城市風貌插畫地圖(地標 + 江山 + 文化元素)store-distribution-map.md — 品牌門店 / 服務覆蓋分布圖itinerary-day-trip-map.md — 一日遊 split 海報(左 parchment 行程卡 + 右奇幻寫實地圖,5-7 站點嚴格對齊)references/slides-and-visual-docs/)適合「一頁講清楚一件事」的視覺文檔。當前已落地:
dense-explainer-slides.md — Irasutoya × 霞關混合高密度講解 Slidepolicy-style-slide.md — 政策 / 政府公告 / 白皮書風格說明 Slidevisual-report-page.md — 商業報告執行摘要 / 投資人簡報 / 年報概覽頁educational-diagram-slide.md — 教學示意圖(概念 / 機制 / 流程分解)references/poster-and-campaigns/)適合「品牌主視覺 + campaign + banner + 雜誌封面」。當前已落地:
brand-poster.md — 品牌主海報(產品 / 人物 / 純文字主張)campaign-kv.md — Campaign Key Visual + 衍生 layout 系統banner-hero.md — Web hero / 落地頁 / app banner(橫向構圖 + CTA)editorial-cover.md — 雜誌 / 期刊 / 出版物封面biomimetic-concept-poster.md — 仿生工業設計概念海報(自然原型 → 演化條 → hero render → 多視圖技術圖)vintage-editorial-infographic.md — 復古檔案 / 1940s 編輯式信息圖海報(人物 + 公式 + 時間軸 + 模型,Bell Labs 風)character-catalog-poster.md — 同一角色多版本信息圖海報(星座 / 元素 / 朝代 / 人格系列卡片)lineup-comparison-poster.md — 系列產品 lineup 對比信息圖海報(30+ SKU 同圖 + 圖例 + 等級 key)references/portraits-and-characters/)適合「人物視覺」。當前已落地:
professional-portrait.md — 職業級商務肖像(LinkedIn / 團隊頁 / 媒體配圖)founder-portrait.md — 創始人媒體大片肖像(戲劇燈光 + 留標題位)virtual-host.md — VTuber / 虛擬主播個人卡 + 直播預覽character-sheet.md — 角色綜合設定稿(三視圖 + 表情 + 服裝 + 配色板)pose-reference-sheet.md — N×N 姿勢 / 動作字典參考表(同一角色多姿勢,舞蹈 / 戰鬥 / 健身)references/scenes-and-illustrations/)適合 「氛圍 + 故事 + 情緒」 的插畫類視覺。當前已落地:
healing-scene.md — 治癒系日常 / 季節場景插畫concept-scene.md — 電影感概念大場景 / IP key artpicture-book-scene.md — 童書 / 繪本內頁 / 節日卡片minimalist-mood-scene.md — 極簡留白氛圍圖 / 文學性壁紙references/editing-workflows/)適合「基於現有圖片做編輯」的圖改任務(對應 scripts/edit.js)。當前已落地:
background-replacement.md — 背景替換(商品 / 人像 / 戶外 / 棚景)local-object-replacement.md — 局部對象替換(配合或不配合蒙版)object-removal.md — 雜物 / 路人 / 電線 / 瑕疵去除product-retouching.md — 產品精修(光澤 / 標籤 / 陰影 / 瑕疵)portrait-local-edit.md — 人像局部修改(髮型 / 服裝 / 妝容 / 配飾)references/avatars-and-profile/)適合「風格化頭像 / 人設 / 網格 / 貼紙 / 系列肖像」等"個人形象"類視覺。當前已落地:
style-transfer-selfie.md — 把參考圖人物轉成 cosplay / 哥特 / 復古膠片 / 偶像寫真等任意風格character-grid-portrait.md — 同一角色 n×n 網格肖像(多職業 / 多表情 / 多朝代 / 多風格)themed-3d-icon.md — Kawaii 3D / Minecraft / 擬物 3D 應用圖標式頭像sticker-set.md — 貼紙套裝 / 表情包合集(獨立元素 + 描邊 + 標籤)cultural-portrait-series.md — 朝代 / 神話 / 文學 / 民族系列肖像references/storyboards-and-sequences/)適合「多分鏡 / 漫畫 / 關係圖 / 流程步驟」等"敘事性序列"類視覺。當前已落地:
four-panel-comic.md — 4 格漫畫 / 諷刺漫畫 / 段子漫畫(起承轉合 + 對話氣泡)manga-spread-page.md — 單頁 / 跨頁漫畫分鏡(不規則格子 + 對話 + 心聲)anime-key-visual.md — 單圖動漫 KV / 輕小說封面 / IP 海報character-relationship-diagram.md — 角色關係圖海報(卡片 + 關係連線 + 圖例)recipe-process-flowchart.md — 食譜 / 教程 / 流程步驟圖(編號 + 插圖 + 說明)product-tvc-storyboard.md — 產品 TVC 商業廣告分鏡板(9-panel 實拍質感 + 鏡頭描述 + 時長)cinematic-storyboard-grid.md — 電影感敘事分鏡 contact sheet(3×4 / 4×4,連續敘事 + cinematic still)process-photo-board.md — 真人 cinematic 流程板(裝備穿戴 / 化妝 / 訓練 / 操作分解,編號 + 步驟遞進)references/grids-and-collages/)適合「多面板網格 / 拼貼 / 立項 board」類視覺。當前已落地:
banner-grid-2x2.md — 2×2 營銷 banner 套裝(一次出 4 張統一系列設計)lookbook-grid.md — 7 日 lookbook / 9 宮 self-care / TOP N 清單圖mixed-style-multi-panel.md — 多風格混合拼貼(同一主體不同畫風演繹)anime-pitch-board.md — 動漫 / 遊戲 / 影視立項 pitch board(KV + 角色 + 世界觀 + 文案)ad-banner-multi-grid.md — 多行業 / 多主題混合廣告 banner 網格(每格獨立行業 + 風格 + 文案)references/branding-and-packaging/)適合「品牌識別系統 / 吉祥物 / 包裝設計」類視覺。當前已落地:
brand-identity-board.md — 品牌識別系統板(logo + 配色 + 字體 + 應用 mockup)mascot-brand-kit.md — 吉祥物多面板品牌識別套裝(主形象 + 三視圖 + 表情 + 應用)cosmetic-packaging.md — 化妝品 / 護膚品 單瓶 / 系列 / 禮盒包裝beverage-label-design.md — 飲料 / 食品 / 調味品標籤設計(國潮 / 日式 / 西式)full-mascot-brand-doc.md — 18+ 模塊大型品牌識別 + 吉祥物全流程文檔(DNA / moodboard / 草圖 / 線稿 / 3D / 配色 / 材質 / 應用一圖概覽)character-merch-board.md — IP 角色 + 周邊 / 包裝 / 海報 / 社交 profile 多元素綜合品牌板references/typography-and-text-layout/)適合「字面優先 / 雙語版式」等"以文字爲主視覺"的類型。當前已落地:
title-safe-poster.md — 大字主張型海報(日式高能量 / 瑞士極簡 / 復古印刷)bilingual-layout-visual.md — 中英 / 中日雙語版式視覺(文化 / 學術 / 跨文化品牌)references/assets-and-props/)適合「圖標集 / 遊戲截圖」等"成套素材 / 遊戲資產"類視覺。當前已落地:
retro-skeuomorphic-icons.md — 擬物 / Y2K / 像素 圖標集(成套統一風格)game-screenshot-mockup.md — 遊戲內截圖 mockup(HUD + 字幕 + 任務面板)references/academic-figures/)適合「論文 / 頂會投稿 / 學術海報 / 答辯 PPT / 開題答辯 / 期刊投稿 Graphical Abstract」的配圖。整體偏白底 + 出版物字體 + 幾何精確 + 低飽和工程色(深藍 / 灰藍 / 黑灰爲主,≤3 主色)+ 可單色印刷。嚴格禁止虛構定量數據(數值 / 等值線 / 色標範圍 / 公式)。
CS / CV / ML 方向:
method-pipeline-overview.md — 方法總覽圖 / pipeline figure(多 stage 塊 + 數據流;變體 4 提供工程類左/中/右 三段式技術路線圖)neural-network-architecture.md — 神經網絡架構圖(layer 塊 + tensor shape + 跳連)qualitative-comparison-grid.md — 多方法 qualitative 對比網格(行 = 樣本,列 = 方法)工程 / 自然科學 / 答辯通用:
scientific-schematic.md — 概念 / 原理 / 實驗裝置示意圖(自由度高,自然語言模板)mechanism-diagram.md — 機理示意圖 / 因果鏈路 / 轉化路徑(中心對象 + 多階段轉化 + 結果區;含三段式因果鏈 / 循環自激發 / 多分支競爭 三種變體)multi-condition-comparison.md — 多工況 / 多條件結果對比圖(同一對象在不同 condition 下的並列結果,2×2 / 1×N / M×N;強調 panel 間嚴格統一)publication-chart.md — publication-ready 數據圖表(bar / line / scatter / heatmap / box)總覽 / 摘要 / 答辯首頁:
graphical-abstract.md — 期刊投稿 Graphical Abstract / 圖形摘要(橫向 4 段式 / 中心展開 / 方形 / 豎版四種變體)research-overview-poster.md — 開題 / 答辯 / 匯報首頁研究總覽圖(上中下三層 + 五模塊;含中心輻射 / 左右雙欄 / 極簡 三種變體)選擇策略:CS/CV/ML 論文首選
method-pipeline-overview+qualitative-comparison-grid;工程 / 能源 / 化工 / 材料方向首選method-pipeline-overview變體 4 +mechanism-diagram+multi-condition-comparison;投稿期刊摘要圖用graphical-abstract;答辯 PPT 首頁用research-overview-poster。
references/infographics/)適合「信息圖 / 高密度科普 / 手繪信息圖 / KPI 儀錶盤」等"信息可視化大圖"。當前已落地:
legend-heavy-infographic.md — 高圖例密度科普 / 因果鏈 / 演化 / 解剖圖(雙語)hand-drawn-infographic.md — 手繪風信息圖(macaron / morandi / 黑板 / 牛皮紙;自然語言模板)bento-grid-infographic.md — 便當格模塊化信息圖(高密度多模塊 widget 排布)comparison-infographic.md — 二元 / 多元對比信息圖(A vs B / 套餐檔位 / 誤區 vs 正解)step-by-step-infographic.md — 步驟教程信息圖(插畫感、溫暖;非工程流程圖)kpi-dashboard-infographic.md — KPI 儀錶盤式信息圖(年度回顧 / Wrapped / 業務 dashboard)references/technical-diagrams/)適合「系統架構 / 流程 / 時序 / 狀態機 / ER / 思維導圖 / 網絡拓撲」等工程示意圖。統一暗色 grid 背景 + 等寬字體 + 角色編碼配色,每個模板都附 light 變體。
⚠️ 注意:本目錄生成的是 PNG 位圖,不是可編輯 SVG;需要可編輯請改用 mermaid / draw.io / excalidraw / Figma。當前已落地:
system-architecture.md — 系統架構圖(前端 + 後端 + DB + 緩存 + 隊列 + 外部)flowchart-decision.md — 流程圖 / 決策圖(BPMN 形狀語義 + Yes/No 分支)sequence-diagram.md — 時序圖(actor + lifeline + 消息箭頭 + 激活條)state-machine.md — 狀態機 / 生命周期圖(state + transition + guard / action)er-diagram.md — ER 圖 / 數據模型圖(實體 + 字段 + PK/FK + crow's foot 關係)mind-map-tech.md — 技術主題思維導圖(中央 + 放射式分支)network-topology.md — 網絡拓撲圖(設備 glyph + zone / VPC + 帶寬 / 協議標)無論 A / B / C,前 6 步是共用的;區別只在第 7-8 步如何"出圖"。
check-mode.js 確定模式(A / B / C)。infographics/hand-drawn-infographic.md、academic-figures/scientific-schematic.md 等)使用「結構化自然語言 + 參數」混合形式,因爲強行 JSON 會限制創作自由。到此 prompt 已渲染好。下面按模式分叉:
7-A. Mode A:把最終 prompt 保存到 garden-gpt-image-2/prompt/,調用 scripts/generate.js 或 scripts/edit.js,圖片落到 garden-gpt-image-2/image/。
7-B. Mode B:把最終 prompt 直接傳給宿主的圖像工具調用;按需保存 prompt 副本到 garden-gpt-image-2/prompt/。
7-C. Mode C:把最終 prompt 保存到 garden-gpt-image-2/prompt/<task-slug>-<timestamp>.md,並把完整 prompt 在對話中展示給用戶,附一句簡短的"如何使用 / 推薦工具"建議。
通用:
僅 Mode A 適用:
data[0].b64_json 解析,也兼容 data[0].url只在這些信息缺失且會顯著影響結果時提問:
除此之外,優先自己做合理默認並繼續執行。
npx claudepluginhub chester930/garden-skills --plugin presentation-skillsCreates, edits, and optimizes skills for Claude Code, including drafting, evaluating with test prompts, iterating on performance, and improving skill descriptions for better triggering accuracy.