skills/paper-explainer/SKILL.md
将学术论文PDF转化为结构化、可视化的精讲文档。 触发场景: (1) 用户提供PDF论文文件并要求讲解/分析 (2) 用户询问"帮我讲解这篇论文"、"分析这个PDF" (3) 用户需要提取论文的核心方法、实验结果 (4) 用户希望生成论文的可视化HTML摘要 支持: AI/ML、CV、NLP、系统、理论等计算机科学领域论文
npx skillsauth add laborany/laborany 论文讲解助手Install this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
将复杂学术论文转化为结构化、易理解的知识文档。
PDF输入 → 解析提取 → 深度分析 → HTML输出
运行 scripts/parse_pdf.py 提取原始内容:
python scripts/parse_pdf.py <论文.pdf> -o parsed.json --image-dir ./images
输出结构:
{
"pages": [{"page_num": 1, "text": "...", "tables": [...]}],
"images": [{"page_num": 1, "image_index": 1, "path": "..."}]
}
阅读解析结果,提取以下信息:
| 字段 | 来源 | 说明 | |------|------|------| | title | 首页顶部 | 论文标题 | | authors | 标题下方 | 作者列表 | | affiliations | 脚注/作者下 | 机构信息 | | motivation | Abstract + Intro | 研究动机与问题 | | method | Method章节 | 核心方法详解 | | experiments | Experiments章节 | 实验设置与结果 |
分析要点 (详见 references/analysis_guide.md):
对提取的图片进行分类,识别其用途:
| 类型 | 特征 | 嵌入位置 | |------|------|----------| | 框架图 | 展示整体架构/流程,通常较大,含模块和箭头 | method 开头 | | 模块细节图 | 展示单个组件内部结构 | method 对应段落 | | 实验曲线 | 折线图/柱状图,含坐标轴和图例 | experiments 对应分析处 | | 可视化结果 | 热力图/注意力图/生成样本 | experiments 定性分析处 | | 示意图 | 概念解释/对比图 | motivation 或 method | | 其他 | Logo/装饰/无关图片 | 仅放附录或忽略 |
分类方法:
嵌入策略:
<figure> 标签嵌入,配详细说明构造分析结果JSON:
{
"title": "论文标题",
"authors": "作者1, 作者2",
"affiliations": "机构1; 机构2",
"motivation": "<p>HTML格式的动机分析</p>",
"method": "<p>HTML格式的方法讲解,支持$LaTeX$公式</p>",
"experiments": "<p>HTML格式的实验分析</p>",
"images": [...],
"embedded_images": {
"motivation": [{"index": 0, "caption": "图1说明", "position": "after_intro"}],
"method": [{"index": 1, "caption": "框架图说明", "position": "start"}],
"experiments": [{"index": 2, "caption": "实验结果图", "position": "inline"}]
}
}
embedded_images 字段说明:
index: 对应 images 数组中的索引caption: 图片说明文字position: 嵌入位置 (start/inline/end)运行生成脚本:
python scripts/generate_html.py analysis.json -o 论文讲解.html
$E=mc^2$$$\sum_{i=1}^n x_i$$<h3>子标题</h3>
<p>段落文本,支持<code>代码</code>和<strong>强调</strong></p>
<ul><li>列表项</li></ul>
智能嵌入 (推荐):
嵌入语法:
<figure class="embedded-figure">
<img src="data:image/png;base64,..." alt="框架图">
<figcaption>图1: 模型整体架构。输入经过编码器...</figcaption>
</figure>
附录处理:
pip install pdfplumber PyMuPDF
# 1. 解析PDF
python scripts/parse_pdf.py attention.pdf -o parsed.json
# 2. 分析内容 (Claude完成)
# 生成 analysis.json
# 3. 生成HTML
python scripts/generate_html.py analysis.json -o attention_explained.html
data-ai
AI 视频工厂,用于完整测试和执行 LaborAny 的多模态视频生产链路。 适用于: (1) 用户给一个爆款视频,要求拆解脚本、分镜、动作、配乐、镜头语言并复刻或改写; (2) 用户给一个想法,要求规划完整短视频、生成角色一致的关键帧图片、调用视频生成模型生成分段视频; (3) 用户要求把多个 15s 视频片段剪辑合成为最终成片; (4) 用户明确说“测试完整图片/视频理解和生成流程”“AI剧集”“分镜视频”“爆款视频拆解”。
testing
Inspect Playwright trace files from the command line — list actions, view requests, console, errors, snapshots and screenshots.
tools
Automate browser interactions, test web pages and work with Playwright tests.
development
LaborAny 设计大师——用 HTML 做高保真原型、交互 Demo、幻灯片、动画、设计变体探索 + 设计方向顾问 + 专家评审的一体化设计能力。HTML 是工具不是媒介,根据任务 embody 不同专家(UX 设计师 / 动画师 / 幻灯片设计师 / 原型师),避免 web design tropes。 触发场景:做原型、设计 Demo、交互原型、HTML 演示、动画 Demo、设计变体、hi-fi 设计、UI mockup、prototype、设计探索、做个 HTML 页面、做个可视化、app 原型、iOS 原型、移动应用 mockup、导出 MP4、导出 GIF、60fps 视频、设计风格、设计方向、设计哲学、配色方案、视觉风格、推荐风格、选个风格、做个好看的、评审、好不好看、review this design。 主干能力:Junior Designer 工作流、反 AI slop 清单、React+Babel 最佳实践、Tweaks 变体切换、Speaker Notes 演示、Starter Components、App 原型专属守则、Playwright 验证、HTML 动画 → MP4/GIF 视频导出(25fps 基础 + 60fps 插帧 + palette 优化 GIF + 6 首场景化 BGM + 自动 fade)。 需求模糊时的 Fallback:设计方向顾问模式——从 5 流派 × 20 种设计哲学推荐 3 个差异化方向。 交付后可选:专家级 5 维度评审。