Name: pdf-master
Author: zshyc

Stats

Actions

Available In

Tags

特性

说明

🧩 一站式

无需组合多个工具，一个插件覆盖所有 PDF 场景

🤖 8 大 AI 平台

Claude / OpenAI / Gemini / DeepSeek / Qwen / 智谱 / Moonshot / Ollama

🔍 双引擎 OCR

Tesseract + PaddleOCR，覆盖 100+ 语言

🔒 企业级安全

AES-256 加密、敏感信息涂抹、签名验证

📐 LaTeX 渲染

pdflatex / xelatex / lualatex 三大引擎

✅ 生产就绪

343 测试用例 + CI/CD + 完整文档

功能

PDF-Master

pypdf

PyMuPDF

pdfplumber

文本提取

✅

表格提取

✅

❌

✅

图片提取

✅

❌

合并/拆分

✅

❌

水印/旋转

✅

❌

加密/解密

✅

❌

OCR 识别

✅

❌

AI 摘要

✅

❌

AI 翻译

✅

❌

AI 问答

✅

❌

表单填充

✅

❌

LaTeX 渲染

✅

❌

PDF 压缩

✅

❌

✅

❌

PDF 修复

✅

❌

✅

❌

PDF 比较

✅

❌

批量处理

✅

❌

数字签名

✅

❌

PDF/A 转换

✅

❌

安全审计

✅

❌

书签管理

✅

❌

链接管理

✅

❌

注释管理

✅

❌

PDF → Word

✅

❌

# 1. 添加 marketplace /plugin marketplace add ZSHYC/pdf-master # 2. 安装插件 /plugin install pdf-master@zshyc-pdf-master # 3. 重新加载插件 /reload-plugins # 4. 使用插件技能（命名空间格式） /pdf-master:pdf extract document.pdf /pdf-master:pdf summarize document.pdf

# 加载插件后，使用 /pdf 命令 /pdf extract document.pdf # 提取文本 /pdf merge file1.pdf file2.pdf -o merged.pdf /pdf summarize document.pdf # AI 摘要 /pdf ocr scanned.pdf # OCR 识别

# 方式一：环境变量 export ANTHROPIC_API_KEY="your-key" # 方式二：配置文件（推荐） cp config/config.yaml.example config/config.yaml # 编辑 config/providers.yaml # 方式三：CLI 工具 python skills/pdf/scripts/pdf_config.py add

# 文本提取（支持布局保留） python scripts/extract_text.py input.pdf -o output.txt # 表格提取（JSON/CSV/Excel） python scripts/extract_tables.py input.pdf -o tables.json # 图片提取 python scripts/extract_images.py input.pdf -o images/ # 元数据提取 python scripts/extract_metadata.py input.pdf

# 合并 PDF python scripts/merge_pdfs.py file1.pdf file2.pdf -o merged.pdf # 拆分 PDF python scripts/split_pdf.py input.pdf -p 1-5 -o output.pdf # 旋转页面 python scripts/rotate_pdf.py input.pdf --angle 90 -o output.pdf # 添加水印 python scripts/watermark_pdf.py input.pdf --image stamp.png -o output.pdf

# PDF → 图片 python scripts/convert_pdf_to_images.py input.pdf -o images/ # PDF → Excel python scripts/pdf_to_excel.py input.pdf -o output.xlsx # PDF → Markdown python scripts/pdf_to_markdown.py input.pdf -o output.md # PDF → Word (多后端支持) python scripts/pdf_to_word.py input.pdf -o output.docx # 自动选择最佳后端 python scripts/pdf_to_word.py input.pdf -o output.docx --backend pdf2docx # 图片+格式完整保留 python scripts/pdf_to_word.py input.pdf -o output.docx --backend docling # 学术论文高精度解析

后端

Stars

特点

适用场景

pdf2docx

3.4k

图片+格式完整保留

图文混排文档

Docling (IBM)

57.8k

深度学习高精度解析

学术论文、表格结构

pdfplumber

10.1k

简单文本提取

fallback兜底

# 智能摘要 python scripts/summarize_pdf.py document.pdf --provider claude # 文档问答 python scripts/qa_pdf.py document.pdf --question "主要观点是什么？" # AI 翻译 python scripts/translate_pdf.py document.pdf --to en --provider openai

PDF-Master

🚀 全能型 PDF 处理 Claude Code 插件

一个插件，覆盖所有 PDF 场景 — 解析、编辑、转换、AI 增强、OCR、安全

🌐 官网 • 功能特性 • 快速开始 • 使用指南 • AI 配置 • 开发

为什么选择 PDF-Master？

痛点：处理 PDF 需要组合多个工具 — pypdf 提取文本、pdfplumber 提取表格、PyMuPDF 合并拆分、还要单独配置 OCR 和 AI...

解法：PDF-Master 一个插件搞定全部，28+ 种操作，开箱即用。

🎯 核心亮点

特性	说明
🧩 一站式	无需组合多个工具，一个插件覆盖所有 PDF 场景
🤖 8 大 AI 平台	Claude / OpenAI / Gemini / DeepSeek / Qwen / 智谱 / Moonshot / Ollama
🔍 双引擎 OCR	Tesseract + PaddleOCR，覆盖 100+ 语言
🔒 企业级安全	AES-256 加密、敏感信息涂抹、签名验证
📐 LaTeX 渲染	pdflatex / xelatex / lualatex 三大引擎
✅ 生产就绪	343 测试用例 + CI/CD + 完整文档

📊 功能对比

功能	PDF-Master	pypdf	PyMuPDF	pdfplumber
文本提取	✅	✅	✅	✅
表格提取	✅	❌	❌	✅
图片提取	✅	✅	✅	❌
合并/拆分	✅	✅	✅	❌
水印/旋转	✅	✅	✅	❌
加密/解密	✅	✅	✅	❌
OCR 识别	✅	❌	❌	❌
AI 摘要	✅	❌	❌	❌
AI 翻译	✅	❌	❌	❌
AI 问答	✅	❌	❌	❌
表单填充	✅	✅	❌	❌
LaTeX 渲染	✅	❌	❌	❌
PDF 压缩	✅	❌	✅	❌
PDF 修复	✅	❌	✅	❌
PDF 比较	✅	❌	❌	❌
批量处理	✅	❌	❌	❌
数字签名	✅	❌	❌	❌
PDF/A 转换	✅	❌	❌	❌
安全审计	✅	❌	❌	❌
书签管理	✅	❌	❌	❌
链接管理	✅	❌	❌	❌
注释管理	✅	❌	❌	❌
PDF → Word	✅	❌	❌	❌

🚀 快速开始

前置要求

Python 3.8+
Claude Code CLI

安装方式

方式一：通过 Plugin Marketplace 安装（推荐）

# 1. 添加 marketplace
/plugin marketplace add ZSHYC/pdf-master

# 2. 安装插件
/plugin install pdf-master@zshyc-pdf-master

# 3. 重新加载插件
/reload-plugins

# 4. 使用插件技能（命名空间格式）
/pdf-master:pdf extract document.pdf
/pdf-master:pdf summarize document.pdf

方式二：本地开发安装

# 克隆仓库
git clone https://github.com/ZSHYC/pdf-master.git
cd pdf-master

# 安装核心依赖
pip install -r requirements.txt

# 使用 --plugin-dir 测试
claude --plugin-dir .

方式三：手动安装到项目

# 复制到项目目录
cp -r pdf-master .claude/plugins/

# 在 .claude/settings.json 中启用
{
  "enabledPlugins": {
    "pdf-master@local": true
  }
}

在 Claude Code 中使用

# 加载插件后，使用 /pdf 命令
/pdf extract document.pdf              # 提取文本
/pdf merge file1.pdf file2.pdf -o merged.pdf
/pdf summarize document.pdf            # AI 摘要
/pdf ocr scanned.pdf                   # OCR 识别

配置 AI 服务（可选）

# 方式一：环境变量
export ANTHROPIC_API_KEY="your-key"

# 方式二：配置文件（推荐）
cp config/config.yaml.example config/config.yaml
# 编辑 config/providers.yaml

# 方式三：CLI 工具
python skills/pdf/scripts/pdf_config.py add

📚 使用指南

📤 解析提取

# 文本提取（支持布局保留）
python scripts/extract_text.py input.pdf -o output.txt

# 表格提取（JSON/CSV/Excel）
python scripts/extract_tables.py input.pdf -o tables.json

# 图片提取
python scripts/extract_images.py input.pdf -o images/

# 元数据提取
python scripts/extract_metadata.py input.pdf

✏️ 编辑修改

# 合并 PDF
python scripts/merge_pdfs.py file1.pdf file2.pdf -o merged.pdf

# 拆分 PDF
python scripts/split_pdf.py input.pdf -p 1-5 -o output.pdf

# 旋转页面
python scripts/rotate_pdf.py input.pdf --angle 90 -o output.pdf

# 添加水印
python scripts/watermark_pdf.py input.pdf --image stamp.png -o output.pdf

🔄 格式转换

# PDF → 图片
python scripts/convert_pdf_to_images.py input.pdf -o images/

# PDF → Excel
python scripts/pdf_to_excel.py input.pdf -o output.xlsx

# PDF → Markdown
python scripts/pdf_to_markdown.py input.pdf -o output.md

# PDF → Word (多后端支持)
python scripts/pdf_to_word.py input.pdf -o output.docx              # 自动选择最佳后端
python scripts/pdf_to_word.py input.pdf -o output.docx --backend pdf2docx  # 图片+格式完整保留
python scripts/pdf_to_word.py input.pdf -o output.docx --backend docling   # 学术论文高精度解析

PDF → Word 后端对比 (2026年最新)

后端	Stars	特点	适用场景
pdf2docx	3.4k	图片+格式完整保留	图文混排文档
Docling (IBM)	57.8k	深度学习高精度解析	学术论文、表格结构
pdfplumber	10.1k	简单文本提取	fallback兜底

🤖 AI 增强

# 智能摘要
python scripts/summarize_pdf.py document.pdf --provider claude

# 文档问答
python scripts/qa_pdf.py document.pdf --question "主要观点是什么？"

# AI 翻译
python scripts/translate_pdf.py document.pdf --to en --provider openai

🔍 OCR 识别

# Tesseract OCR
python scripts/ocr_pdf.py scanned.pdf -o output.txt --engine tesseract --lang chi_sim+eng

pdf-master

Popularity

What's Inside

Confidence

Setup

Configuration

README

PDF-Master

为什么选择 PDF-Master？

🎯 核心亮点

📊 功能对比

🚀 快速开始

前置要求

安装方式

方式一：通过 Plugin Marketplace 安装（推荐）

方式二：本地开发安装

方式三：手动安装到项目

在 Claude Code 中使用

配置 AI 服务（可选）

📚 使用指南

📤 解析提取

✏️ 编辑修改

🔄 格式转换

🤖 AI 增强

🔍 OCR 识别

Similar Plugins

pdf

anthropic-office-skills

mineru

documents

openai-pdf

aurochs-claude-plugin

PDF-Master

为什么选择 PDF-Master？

🎯 核心亮点

📊 功能对比

🚀 快速开始

前置要求

安装方式

方式一：通过 Plugin Marketplace 安装（推荐）

方式二：本地开发安装

方式三：手动安装到项目

在 Claude Code 中使用

配置 AI 服务（可选）

📚 使用指南

📤 解析提取

✏️ 编辑修改

🔄 格式转换

🤖 AI 增强

🔍 OCR 识别

Popularity

Health & Quality

Similar Plugins

pdf

anthropic-office-skills

mineru

documents

openai-pdf

aurochs-claude-plugin