By tomoaid
會議錄音工作流 plugin。meeting-notes:錄音 → 聲紋識別 speaker-labeled 逐字稿 → 結構化會議記錄 .md(產出到本地檔案為止)。voiceprint-setup:diarization 切出 speaker 樣本 → 本地 HTML 介面標記 → 建立團隊聲紋庫。需要 OpenAI 與 pyannote.ai API key。
將會議錄音轉成結構化的會議記錄 .md。流程:用 pyannote.ai 聲紋識別(聲紋庫由 voiceprint-setup skill 建立,沒建立要先警告)+ OpenAI whisper-1 ASR 產生 speaker-labeled 逐字稿(使用者確認後才 fallback 到 gpt-4o-transcribe plain 逐字稿)→ 清理口頭禪、雜訊、ASR 錯字、保留 speaker label → 把原始音檔與清理後的逐字稿存進專案會議目錄 → 產出 `YYYY-MM-DD-{topic-slug}.md` 會議記錄 → 統一回報產出檔案與不確定的點(**不自動 commit、不開 PR、不開 Issue**,後續由使用者自行決定)。當用戶提供本地錄音檔(.m4a / .mp3 / .wav / .webm / .mp4 等),或語意上想「整理會議」「轉逐字稿」「寫會議紀要」「產 Action Items」「會議摘要」「meeting transcript」「meeting notes」「整理開會內容」時觸發。即使用戶沒有明說「會議記錄」四個字,只要丟出錄音檔且暗示要整理內容,就要用此 skill;不要自己用 whisper 或別的方式硬轉。
建立或更新團隊聲紋庫(voiceprints.json)。流程:使用者提供一段多人會議錄音 → pyannote.ai diarization 把錄音依 speaker 分段 → 為每位 speaker 切出拼接樣本(最長 29 秒,盡量長辨識度才好)→ 開本地 HTML 介面讓使用者試聽並標記人名 → 對標記過的樣本建立 voiceprint 寫入聲紋庫。後續 meeting-notes skill 就用這個聲紋檔做 speaker 識別。當使用者想「設定聲紋」「建立聲紋庫」「voiceprint setup」「新增成員聲紋」「聲紋失準重做」,或 meeting-notes 跑之前發現聲紋庫不存在需要先建立時觸發。
把會議錄音變成「知道誰說了什麼」的結構化會議記錄,全程在 Claude Code 裡完成。
兩個 skill:
| Skill | 做什麼 |
|---|---|
/tomoaid:meeting-notes | 錄音 → 聲紋識別 speaker-labeled 逐字稿 → 清理 → 結構化會議記錄 .md(含 Action Items),產出到本地檔案為止 |
/tomoaid:voiceprint-setup | 用一段多人會議錄音建立團隊聲紋庫:diarization 自動切出每位 speaker 的樣本 → 本地網頁試聽標記人名 → 寫入聲紋庫 |
**Alice** [00:00:12–00:00:34],不是匿名的 SPEAKER_00/plugin marketplace add tomoaid/claude-plugin
/plugin install tomoaid@tomoaid
安裝時可選 Project scope,plugin 只在當前專案啟用。
要讓隊友 clone 專案後自動啟用、且只在該專案生效,把這段提交進該專案的 .claude/settings.json:
{
"extraKnownMarketplaces": {
"tomoaid": {
"source": { "source": "github", "repo": "tomoaid/claude-plugin" }
}
},
"enabledPlugins": {
"tomoaid@tomoaid": true
}
}
隊友信任(trust)該專案資料夾後,Claude Code 會提示安裝 marketplace 與 plugin,不影響其他專案。
OPENAI_API_KEY(whisper-1 / gpt-4o-transcribe 轉錄)PYANNOTEAI_API_KEY(diarization 與 voiceprint,https://pyannote.ai)ffmpeg / ffprobe(brew install ffmpeg)curl(macOS / 多數 Linux 內建,OpenAI 上傳用)第一次先建聲紋庫(拿一段大家都有發言的會議錄音):
/tomoaid:voiceprint-setup ./recordings/last-meeting.m4a
瀏覽器會開一個標記頁面,逐段試聽、填上成員英文名、儲存。之後整理會議就一句話:
/tomoaid:meeting-notes ./recordings/2026-06-11.m4a
產出三個檔案:meetings/<date>-<topic>.md(會議記錄)、meetings/transcripts/(清理後逐字稿)、meetings/recordings/(音檔,自動 gitignore)。
預設路徑:聲紋庫 .tomoaid/voiceprints.json、詞彙表 .tomoaid/asr-glossary.md、輸出 meetings/。要改就在專案根目錄放 .tomoaid.json:
{
"voiceprints": "company/voiceprints.json",
"glossary": "company/asr-glossary.md",
"meetings_dir": "meetings"
}
詞彙表強烈建議建立(範例見 examples/asr-glossary.example.md):一段包含團隊成員名、產品名、客戶代號、常用術語的繁體文字,會餵給 ASR 當 priming,是改善專有名詞辨識最有效的手段。
MIT
Own this plugin?
Verify ownership to unlock analytics, metadata editing, and a verified badge. GitHub access is read-only (username + org membership).
Sign in to claimOwn this plugin?
Verify ownership to unlock analytics, metadata editing, and a verified badge. GitHub access is read-only (username + org membership).
Sign in to claimBased on adoption, maintenance, documentation, and repository signals. Not a security audit or endorsement.
npx claudepluginhub tomoaid/claude-plugin --plugin tomoaidUltra-compressed communication mode. Cuts ~75% of tokens while keeping full technical accuracy by speaking like a caveman.
Frontend design skill for UI/UX implementation
Comprehensive UI/UX design plugin for mobile (iOS, Android, React Native) and web applications with design systems, accessibility, and modern patterns
Memory compression system for Claude Code - persist context across sessions
Marketing skills for AI agents — conversion optimization, copywriting, SEO, paid ads, ad creative, and growth
Standalone image generation plugin using Nano Banana MCP server. Generates and edits images, icons, diagrams, patterns, and visual assets via Gemini image models. No Gemini CLI dependency required.