drclaw/agent_hub/templates/paper-push/skills/daily-paper-push-writing/SKILL.md
A research/push notification writing guide. Use this skill with high priority when users ask you to perform tasks like daily paper push.
npx skillsauth add qzzqzzb/drclaw daily-paper-push-writingInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
daily-paper-push-writing 是一个写作技能,提供一种生成每日科研论文汇总的规范化写作流程,从而帮助用户高效获取特定领域的最新研究成果和重要信息。
📚 领域:XXX | 📊 关键词:关键词1、关键词2、关键词3
🌟 No.1 📄 论文标题
📝 作者:[作者列表] 📅 发布时间:20XX年XX月 🔗 论文链接:👉 [arXiv/论文链接] 🏷️ arXiv ID:arXiv:XXXX.XXXXX 📋 摘要:[论文摘要...]
📝 Overview 精华(由 LLM 从 PDF 文本提取):
[LLM 提取的论文核心观点、研究动机、关键贡献...]
📊 实验结果图表:
💡 学术价值分析:简要分析该论文的研究创新点、实验方法、潜在应用价值~
🌟 No.2 📄 论文标题
📝 作者:[作者列表] 📅 发布时间:20XX年XX月 🔗 论文链接:👉 [arXiv/论文链接] 🏷️ arXiv ID:arXiv:XXXX.XXXXX 📋 摘要:[论文摘要...]
📝 Overview 精华(由 LLM 从 PDF 文本提取):
[LLM 提取的论文核心观点、研究动机、关键贡献...]
📊 实验结果图表:
💡 学术价值分析:简要分析该论文的研究创新点、实验方法、潜在应用价值~
🌟 No.3 📄 论文标题
📝 作者:[作者列表] 📅 发布时间:20XX年XX月 🔗 论文链接:👉 [arXiv/论文链接] 🏷️ arXiv ID:arXiv:XXXX.XXXXX 📋 摘要:[论文摘要...]
📝 Overview 精华(由 LLM 从 PDF 文本提取):
[LLM 提取的论文核心观点、研究动机、关键贡献...]
📊 实验结果图表:
💡 学术价值分析:简要分析该论文的研究创新点、实验方法、潜在应用价值~
🌟 No.4 📄 论文标题
📝 作者:[作者列表] 📅 发布时间:20XX年XX月 🔗 论文链接:👉 [arXiv/论文链接] 🏷️ arXiv ID:arXiv:XXXX.XXXXX 📋 摘要:[论文摘要...]
📝 Overview 精华(由 LLM 从 PDF 文本提取):
[LLM 提取的论文核心观点、研究动机、关键贡献...]
📊 实验结果图表:
💡 学术价值分析:简要分析该论文的研究创新点、实验方法、潜在应用价值~
🌟 No.5 📄 论文标题
📝 作者:[作者列表] 📅 发布时间:20XX年XX月 🔗 论文链接:👉 [arXiv/论文链接] 🏷️ arXiv ID:arXiv:XXXX.XXXXX 📋 摘要:[论文摘要...]
📝 Overview 精华(由 LLM 从 PDF 文本提取):
[LLM 提取的论文核心观点、研究动机、关键贡献...]
📊 实验结果图表:
💡 学术价值分析:简要分析该论文的研究创新点、实验方法、潜在应用价值~
每篇论文需要获取:
┌─────────────────────────────────────────────────────────────┐
│ Step 1: 下载 PDF (一次下载,后续复用) │
│ python scripts/pdf_download.py <arxiv_id> [output_dir] │
└─────────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────┐
│ Step 2: PDF 转文本 (供 LLM 读取 Overview) │
│ python scripts/pdf_to_text.py <pdf> <output.txt> │
└─────────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────┐
│ Step 3: 提取图表 (默认第1张 = 架构图) │
│ python scripts/pdf_figure_capture.py <pdf> <output.png> │
└─────────────────────────────────────────────────────────────┘
python scripts/pdf_download.py <arxiv_id> [output_dir]
示例:
# 下载到默认 ./pdfs/ 目录
python scripts/pdf_download.py 1706.03762
# 下载到指定目录
python scripts/pdf_download.py 1706.03762 ./my_pdfs/
# 强制重新下载
python scripts/pdf_download.py 1706.03762 --force
python scripts/pdf_to_text.py <arxiv_id|pdf_path> <output_path> [options]
示例:
# 转换为完整文本(通过 arXiv ID - 会自动下载)
python scripts/pdf_to_text.py 1706.03762 paper.txt
# 使用本地 PDF(更快)
python scripts/pdf_to_text.py ./pdfs/1706.03762.pdf overview.txt
# 只提取 Overview/Introduction 部分
python scripts/pdf_to_text.py ./pdfs/1706.03762.pdf overview.txt --section overview
# 只提取前 5 页
python scripts/pdf_to_text.py ./pdfs/1706.03762.pdf output.txt --pages 5
可选参数:
--section, -s:提取特定章节(overview, method, experiment)--pages, -p:提取前 N 页用途:将文本提供给 LLM,让模型提取 Overview 精华内容,写入推送文档。
python scripts/pdf_figure_capture.py <arxiv_id|pdf_path> <output_path> [options]
示例:
# 使用本地 PDF(更快,无需重复下载)
python scripts/pdf_figure_capture.py ./pdfs/1706.03762.pdf images/001_figure.jpg --figure 1
# 列出论文中所有图表
python scripts/pdf_figure_capture.py ./pdfs/1706.03762.pdf --list
# 截取第 1 张图表(默认架构图)
python scripts/pdf_figure_capture.py ./pdfs/1706.03762.pdf images/001_figure.jpg --figure 1
# 截取第 3 页的所有图表
python scripts/pdf_figure_capture.py ./pdfs/1706.03762.pdf images/ --page 3
可选参数:
--dpi, -r:分辨率,默认 150 DPI--list, -l:列出论文中所有图表(不截取)--figure, -f:指定要截取的图表编号--page, -p:截取指定页面的所有图表所有脚本都依赖以下 Python 包:
requests:下载 PDFpymupdf (fitz):解析 PDFpip install requests pymupdf
pdf_download 下载一次,然后所有操作都使用本地 PDF 路径--list 可以先查看论文有哪些图表,再决定截取哪个最终输出为一个文件夹,其结构如下:
{datetime}_paper_push/
├── images/
│ ├── 001_figure1.jpg # 论文1:实验结果图表
│ ├── 002_figure1.jpg # 论文2:实验结果图表
│ ├── 003_figure1.jpg # 论文3:实验结果图表
│ ├── 004_figure1.jpg # 论文4:实验结果图表
│ └── 005_figure1.jpg # 论文5:实验结果图表
└── paper_push.md # 推送正文(Markdown 格式)
注意:任务完成后请删除 PDF 文件,不在本地缓存。
注意:Overview 内容由 LLM 从 PDF 文本提取,直接写入 Markdown 正文中,无需单独的图片文件。
MD 正文中图片引用使用相对路径:

arxiv-watcher skill 获取目标领域的最新论文pdf_download.py 下载 PDF 到本地pdf_to_text.py 获取文本,将文本提供给 LLM 让其提取 Overview 精华pdf_figure_capture.py 获取主要实验结果图表(默认第1张)content-media
当用户明确要求“写/生成 NSFC 预算说明书”“写预算说明”“生成 budget.tex / budget.pdf”“写国自然预算 justification”时使用。基于用户标书正文或补充材料,输出一份可提交的预算说明书 LaTeX 项目并渲染 `budget.pdf`。若用户未指定工作目录,必须暂停并先要求其指定。⚠️ 不适用:用户只是想了解预算原则;用户仅要预算表数字而不写说明书;或用户是 2026 青年 A/B/C 默认包干制且无需预算说明书的场景。
tools
当用户明确要求"写/润色 NSFC 标书摘要""生成中文摘要和英文摘要""把中文摘要翻译成英文摘要"时使用。输出中文、英文两个版本(英文必须是中文的忠实翻译版),同时输出标题建议(1个推荐标题+5个候选标题及理由)。中文摘要默认≤400字符,英文摘要默认≤4000字符。输出方式:将结果写入工作目录下的 `NSFC-ABSTRACTS.md`。⚠️ 不适用:用户只想翻译一段与标书无关的通用文本(应直接翻译);用户只想写立项依据/研究内容/研究基础正文(应使用对应 nsfc 系列 skill)。
documentation
当用户明确要求"更新项目指南""同步指南""沉淀洞见到指南"时使用。将对话中新产生的可复用写作洞见实时沉淀到项目指南文件,保持术语口径一致、结构稳定、可检验与可复现。调用时必须指定指南文件路径。
content-media
当用户明确要求"从文件/图片/网页/描述中提取综述主题"或"生成主题+关键词+核心问题结构化输出"时使用。支持文件(PDF/Word/Markdown/Tex)、文件夹、图片、自然语言描述、网页 URL 等多种输入源,自动识别输入类型并提取内容,生成可直接用于 systematic-literature-review 及其他文献综述技能的结构化输出。