instances/xiaodazi/skills/deep-doc-reader/SKILL.md
Deep analysis and Q&A for long documents (PDF reports, contracts, papers, manuals). Uses PageIndex MCP to build hierarchical tree indexes and reason over document structure for precise section-level retrieval.
npx skillsauth add malue-ai/dazee-small deep-doc-readerInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
对长 PDF(年报、合同、论文、手册)进行结构化理解和精准问答。通过 PageIndex MCP 将文档构建为层级树索引,实现章节级定位和推理检索。
判断逻辑:
文档相关请求
├── 文件在哪?找某个文件 → 用 local-search
├── 简单摘要/概述 → 用 summarize
├── 编辑 PDF 内容 → 用 PDF 读取类 Skill
├── 创建 Word/Excel → 用 word-processor / excel-analyzer
└── 长文档深度问答(以下场景)→ 用 deep-doc-reader ✅
├── PDF 超过 20 页
├── 需要精确定位到具体章节/页码
├── 需要反复查询同一文档的不同部分
└── 需要理解文档的层级结构
用户提供 PDF 文件后,通过 PageIndex MCP 工具上传并建立树索引:
用户提供 PDF 路径或 URL
↓
调用 PageIndex MCP 上传文档
↓
PageIndex 自动构建层级树索引(目录 → 章节 → 子章节)
↓
返回文档 ID,后续查询使用此 ID
注意:
用户提问:「Q3 营收数据是多少?」
↓
PageIndex 通过树结构推理导航:
文档根节点 → 财务数据章节 → Q3 季度报告 → 营收数据
↓
返回精确内容 + 页码引用
↓
整理回答,附上来源页码
同一文档支持多轮追问,无需重新上传:
用户:「Q3 营收多少?」 → 回答 + 页码
用户:「跟 Q2 对比呢?」 → 自动导航到 Q2 部分
用户:「管理层怎么解释这个变化?」 → 定位 MD&A 章节
## 回答
[具体回答内容]
### 来源
- 📄 第 87 页 - 第三季度财务摘要
- 📄 第 92-93 页 - 营收明细表
## 文档结构
📑 XXX 年度报告(共 156 页)
├── 第一章:公司概况(p.1-15)
├── 第二章:经营情况讨论(p.16-45)
│ ├── 2.1 行业形势(p.16-22)
│ ├── 2.2 经营成果(p.23-38)
│ └── 2.3 现金流分析(p.39-45)
├── 第三章:财务报表(p.46-120)
│ ├── 3.1 资产负债表(p.46-52)
│ ├── 3.2 利润表(p.53-60)
│ └── ...
└── 附录(p.121-156)
development
Local web search (Tavily/Exa, requires API Key). For quick searches. If no Key configured or deep research needed, use cloud_agent instead.
development
Get current weather and forecasts (no API key required).
tools
Send WhatsApp messages to other people or search/sync WhatsApp history via the wacli CLI (not for normal user chats).
tools
Start voice calls via the Moltbot voice-call plugin.