plugins/office/pdf/skills/office-pdf-skills/SKILL.md
PDF 文件操作技能 - 读取解析PDF、提取文本内容、提取嵌入图片。适用于文档阅读、内容提取、PDF数据分析等场景
npx skillsauth add lazygophers/ccplugin plugins/office/pdf/skills/office-pdf-skillsInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
| 文档 | 内容 | 适用场景 | | ---- | ---- | -------- | | SKILL.md | 核心工具、使用方法 | 快速入门 | | examples.md | 完整使用示例 | 实践参考 |
读取 PDF 文件,提取文本、图片和元数据。
参数:
path (string, 必需): PDF 文件路径(本地路径或 URL)extract_text (boolean, 可选): 是否提取文本,默认 trueextract_images (boolean, 可选): 是否提取图片,默认 falseextract_metadata (boolean, 可选): 是否提取元数据,默认 true返回值:
text: 提取的文本内容images: 提取的图片列表metadata: PDF 元数据(标题、作者、页数等)示例:
// 读取 PDF 文本
mcp.call_tool("read_pdf", {
"path": "/path/to/document.pdf",
"extract_text": true
})
// 提取 PDF 图片
mcp.call_tool("read_pdf", {
"path": "/path/to/document.pdf",
"extract_images": true
})
// 获取 PDF 元数据
mcp.call_tool("read_pdf", {
"path": "/path/to/document.pdf",
"extract_metadata": true
})
提取 report.pdf 中的所有文本内容
从 presentation.pdf 中提取所有图片并保存
获取 document.pdf 的作者、标题和页数信息
development
Go 数据库规范——GORM Model 命名 ModelXxx、表名单数、枚举 uint8 + 常量、索引 idx_ 前缀 + deleted_at leading column、禁 time.Time 统一 int64 unix、禁指针/nullable 字段、TEXT/BLOB/JSON 禁 default、AutoMigrate 禁改主键。设计 DB model、写 GORM tag、建索引、做 migration 审查时触发。
development
Go HTTP API 规范——响应始终 200 + body code 字段、路由 /api/* 全 POST 单段 <Action><Model>、中间件逐路由注册禁 Group(prefix,mw...)、handler 仅返回 (rsp,error)、认证走 header。设计 HTTP API、写路由/handler/中间件时触发。
development
Go 项目结构规范——三层架构(API → Impl → State)、全局状态模式、internal/ 私有包、cmd/ 仅 main.go、go.work 多模块、禁止 Repository 接口和 DI 容器、struct 公共字段开头全 omitempty、handler var rsp 顶声明、禁 legacy migration。设计项目骨架、新建目录、组织包、做架构评审时触发。
development
Go 命名规范——Id/Uid 字段(非 ID)、IsActive/HasMFA 布尔前缀、CreatedAt 时间字段、接收者统一用 p、包名全小写无下划线、泛型类型参数描述性命名、集合字段 xxx_list 禁 xxxs 复数、Enum 0 值 XxxNil 禁 Unknown、禁 Status 统一 State、Set/Update 语义区分。定义结构体字段、函数、变量、包、接收者名、泛型、枚举时触发。