skills/ljg-paper/SKILL.md
Paper reader for non-academics. Reads a paper and tells it back as one continuous story — the life of the paper's core proposition (命题), told on a seven-beat spine (主角 / 困境 / 旧路 / 转折 / 解法 / 结局 / 内核): born in a bind on a base-rate ruler, crystallized as a bold conjecture, argued through mechanism and evidence, distilled into a new way of seeing, then walked out of the paper — life-tested and cashed into falsifiable predictions (检验). The job is storytelling that makes the paper land, not academic critique. Use when user shares an arxiv link, paper URL, PDF, or asks to analyze a research paper. Trigger words: '读论文', '讲论文', '把这篇讲给我听', '分析论文', 'paper', or when user shares an academic paper.
npx skillsauth add lijigang/ljg-skills ljg-paperInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
读一篇论文,最难的不是看懂,是讲明白。讲给一个不懂这个领域的聪明人——讲到他能复述出来——你才算读完。
这是一个讲故事的活。一篇论文背后,有主角、有困境、有撞墙、有转折、有解法、有结局、有内核。把这副脊柱先立起来,再往上挂内容;不然写出来就是十份独立汇报拼成的合订本,读者翻两页就走神。
故事真正的主角是论文的命题——作者敢押的那句大胆猜想。整篇讲的就是这个命题的一生:在困境里诞生(前人被两难卡住,水位摆在那儿),在论证里站住(机制和证据把它撑起来),最后走出论文——过博导的审,下生活的水,朝未来押一注。论文讲完,命题不散场。
让一个不懂这个领域的聪明人听完,能把这篇论文当一个故事再讲一遍——讲出五件事:
任一件让听众卡住 = 故事讲砸了。凝练只在 title 上追求;正文该展开就展开——目标不是短,是让人从听不懂走到能复述。
把论文讲成故事,脊柱是这七拍。不是七个子标题,是节奏要求:
七拍讲完,纸内的故事收了;命题的故事还差最后一程——出门。先过博导的审(站不站得住),再下生活的水(哪儿灵、哪儿破),最后朝未来押一注(它要是对,该看到什么)。这一程不归脊柱管,归「博导审稿」「检验」「启发」三节管。
执行 10 步对应到故事弧上:
| 故事拍 | 在执行哪一步 | |---------------------|--------------------| | 主角 + 困境 + 旧路(立尺) | 「问题」整段 | | 转折预告 → 命题登场 | 「问题」收尾 → 「翻译」开头 | | 解法(论证骨架)+ 结局(回尺) | 「翻译」主体 | | 故事道具 | 「核心概念」 | | 内核(视角) | 「洞见」 | | 故事评审 | 「博导审稿」 | | 命题出门(生活测 + 押未来) | 「检验」 | | 听众的故事 | 「启发」 |
写完默读:这读起来像一个人在跟我讲一个故事,还是十段独立汇报?后者 → 重写。
拿 LenVM(让模型一边写一边知道还要写多远)举例:
命题出了论文还能走两步:生活里,演讲台上有倒计时牌的人收得住,没有的人拖堂——站住了;押一注:往后一两年,长度控制会从"卡死上限"转向"预测剩余"。
写出来不是七个段落,是一条线——把这七拍藏在「问题→翻译→核心概念→洞见」的连续叙述里,读者只感受到一个故事在走。
*bold*(单星号),禁止 **bold*** 开始,不跳级所有图表用纯 ASCII 字符。允许:+ - | / \ > < v ^ * = ~ . : # [ ] ( ) _ , ; ! ' " 和空格。禁止 Unicode 绘图符号。
输出结构依据 references/template.org。禁止参考 ~/Documents/notes/ 中已有论文文件的章节结构——旧文件可能使用过期模板。
Section 名固定:问题 / 翻译 / 核心概念 / 洞见 / 博导审稿 / 检验 / 启发。「检验」是 v6 新增,其余沿用——这些名字已沉淀 craft 含义。不重命名为"第一幕/第二幕"。故事弧体现在每段的写法和衔接上,不在标签上。禁止英文戏剧术语外露(protagonist / climax / resolution 等),框架词全中文。
date +%Y%m%dT%H%M%Sdate "+%Y-%m-%d %a %H:%M"{时间戳}--paper-{简短标题}__paper.org~/Documents/notes/#+title: {一句精练语句提炼论文核心思想或发现}
#+subtitle: {论文原始标题,通常英文}
#+date: [{YYYY-MM-DD Day HH:MM}]
#+filetags: :paper:
#+identifier: {YYYYMMDDTHHMMSS}
#+source: {URL 或来源描述}
#+authors: {作者列表}
#+venue: {发表场所/年份}
title 是这篇笔记的灵魂句——读者扫一眼就知道这篇论文带走什么。它不是文件名,不是方法名,是故事内核的凝练表达。
不是"把一段话压成一句话",是用最少的字把整个故事的内核取出来。抽出 title 贴墙上,它本身就该像一句警句、一个篇名、一句能记住的话。
写作约束(按优先级)
中文母语凝练 — 像汪曾祺、王小波、阿城、李娟的标题:短、净、有刃。
~/.claude/PAI/USER/AI_WRITING_PATTERNS.md(必扫 Layer A)。零中英混杂 — title 不出现英文术语(RL / HR / Agent / Multi-agent / token 等都不行)。术语放正文展开,title 只放思想。例外:人名、产品名(GPT、Claude)。
6-15 字 — 短到能记住,长到能承得住一个发现。超过 15 字基本就是没炼到位——回去再砍。
动词为骨,名词具体 — 形容词能砍就砍("重大的""根本的""惊人的"全删)。每个字都得干活。
自带张力,三种姿态任选其一:
不复述题目,不当方法名 —
正例对照(看转化方向)
| 论文核心思想 | ✗ 翻译腔 / 口语化 | ✓ 中文凝练 | |------------|------------------|-----------| | 奖励信号把模型锁在已会轨迹里,擦掉题目就解锁 | 奖励信号会把模型锁死在已会的轨迹里,擦掉题目就解锁了 | 学会,反成枷锁 | | 只用错样本做 RL,反思能力自己长出来 | 只用错样本做 RL,反思能力自己长出来 | 错处长出反省 | | 模型在向量空间里思考比生成 token 更省更准 | 模型在向量里想,比一边想一边写更省、更准、更快 | 默想胜出口 | | 多智能体缺的是组织协调而非个体智能 | Multi-agent 缺的不是聪明,是 HR——成功率 69 跳到 85 | 多智不如善织 | | 老师与学生看待问题的角度不同导致教学失败 | 老师比学生高分还教不会,是因为他想问题的姿势跟学生不一样 | 高分难为师 | | 写作时预测剩余长度让模型知道何时收尾 | 把"还要写多长"做成一个值函数,模型每写一个 token 就知道离收尾还有多远 | 知止方能落笔 |
注意正例的共性:
自检三问(写完默念)
任一答 No → 回去重写,不要凑合发布。
可识别性测试(必须过)
把 title 单独贴出来,给一个没读过这篇论文的人看,问:「这论文大概在讲什么?」——他不需要给出准确答案,但应该有方向感。
如果答得出方向 → title 通过。 如果完全猜不到(典型是高度凝练的古文式 title),必须用中文 subtitle 兜底,让它承担解释功能。英文 subtitle 只是论文原标题,不算兜底:
#+title: 字未出,止已现
#+subtitle: 把"还要写多远"做成一个 value 函数 — Length Value Model: ...
凝练和可识别性必须共存。只凝练 = 6 个月后自己也认不出是哪篇;只可识别 = 退化回 28 字啰嗦句。两个测试都过才发布。
与其他字段的关系
paper-{简短标题} 的「简短标题」是方法名 / 核心概念名(如 prerl、dsrl),用于文件检索;title 是故事内核句,用于内容入口——两者不同字段,互不替代。文件写入后报告路径。
五条核心原则,决定文章是"一个人在讲故事"还是"机器在汇报内容":
讲故事时可以拿的工具,没有哪个是必须的:
确保拿到:标题、作者、摘要、核心方法、结果。
如果论文有一张承载全文核心思路的总览图(overview / architecture diagram,通常是 Figure 1),提取并保存到 ~/Documents/notes/images/,文件名 {identifier}--paper-{简短标题}-overview.png。
判断标准:这张图让人一看就抓住论文在做什么。不是所有论文都有——没有就跳过,不要硬找。
提取方法:
arxiv.org/html/...),找到图片 URL,WebFetch 下载这一节要做的是搭台。三件事按顺序在同一段连续叙述里完成——亲历困境(拍 1+2)、旧路撞墙(拍 3)、转折预告。
不是描述问题,是让读者亲历那个问题。开场给一个具象示例——一个具体场景、一段输入输出、一张失败截图、一个用户故事——让读者在这个例子上看到困境。
不是「大模型在事实回答上存在幻觉问题」,是:「你问 GPT『2023 年图灵奖得主是谁?』它一本正经回答 Yann LeCun。再问一次,它说 Hinton。第三次又变了。」
三拍叙事,同一个例子贯穿:
如果论文没有明确的前作(开创性问题、新领域),两难可以省,尺照立——"之前没人敢碰、公认做不到"也是一种水位——然后直接「亲历→转折预告」。
三拍是节奏要求,不是格式要求——不要硬加 **亲历/**旧路/**转折预告 子标题。问题节用一段连续叙述更有钩力,子标题会把"流"切成"段"。子标题留给翻译节用(机制要分步揭开)。
反例:「本文提出了一种新的 XXX 框架」——这是学术摘要,不是搭台。
「问题」已经把读者带到转折前一刻——这一节不要再重述问题。开头先让命题登场:把作者敢押的那句大胆猜想一句话亮出来,亮到让人想反驳。后面整节就是看作者怎么把这句话撑起来——方法怎么动、证据怎么落。
沿用同一个例子:继续在「问题」里那个具象示例上讲。读者刚刚在那个例子上看到旧路走不通、转折在哪里——你现在带他在同一个例子上一步步打开论文的方法。换例子 = 切语境,读者前面建的直觉就丢了。
唯一豁免:如果同一例子无法支撑机制细节(比如算法过程需要展开数据流),引入"子例子"作为延伸——但子例子必须和父例子在同一问题域里,让读者感觉是"放大镜下看局部",而不是换地图。
开头立锚点:找到一个具象的中心隐喻或画面——锚点描述的是方法在那个例子上的样子。比如「在我们刚才那个图灵奖问题上,方法像一个分诊台:先把不确定的回答拦下来再说」。锚点和「问题」例子焊在一起。
一步步揭开,让读者解锁迷雾:每段往前推一步,每段都给读者一个新视角,"啊,原来如此"的小揭秘累积成对例子的深度理解。揭秘动词:"这时候你看……""于是发生了……""那这一步怎么办呢——他们想到……"。前一段说的事打开后一段的口子。
需要覆盖(都在那个例子上):
子标题按内容需要组织,不必固定。
翻译节必有清单(防止"凝练"把肉削了):
挑出论文中最关键的 3 个概念(方法名、架构组件、数学对象、新定义……),逐个拆解。这些是故事里主角用来转过那个弯的道具——少了任一件,故事就讲不通。
3 个是 floor 不是 ceiling——砍到 2 个通常意味着漏掉了一个隐藏在方法里的关键设计选择(比如 LenVM 的 constant -1 reward——它不是"组件",是让整套机制 work 的设计 trick,必须单独成节讲)。如果论文真的只有 2 个独立关键概念(罕见),明确说明,不硬凑。
每个道具都回到「问题」那个例子上落地——不是孤立讲一个术语,是回到那个例子,让概念在那个语境里浮出水面。读者每解锁一个道具,对那个例子的理解就深一层,迷雾就散一片。
每个道具:
选道具的标准:读者如果不懂这个,后面的内核和故事评审就跟不上。已经在「翻译」里讲透的不重复选。
整个故事最值钱的往往就一个点——作者真正找到的那颗新结晶。它多半是一个视角:原来还能从这个角度看。
用一句话把这个角度说出来,再补一句:它除了这篇论文,还能看什么。这句话应该让听众觉得「这个想法我可以带走」,而不是「哦,论文说了这么个事」。
检验标准:把这句话单独抽出来,脱离论文上下文,它还有没有力量?如果只是在复述论文结论,那不是内核。内核是你听完故事之后自己看到的那个东西——论文里未必直说,但逻辑指向它。
说不出来就重读「翻译」节。如果论文确实没有思想火花,直说「这篇论文是工程改进,没有认知层面的新发现」。不要硬挤。
换身份:这个方向上带了二十年研究生的博导。学生拿着论文来找你,你判断这个故事讲得真不真、值不值得认真对待。
用白话说,像在办公室跟学生聊:
好的说好,差的说差在哪儿。
博导审的是纸内:实验、基线、预设。这一节把命题带出纸外,走两步。
第一步,生活测——拿生活经验当测试场。挑一个读者熟到不用解释的场景,把命题放进去跑:
失灵处不是命题的污点,是命题的边界。摸到边界,读者才算拥有这个命题,而不是背下它。只用一个主场景,至多加一个对照——例子多了切碎直觉(与「一个锚点撑全文」同理)。命题离生活太远测不了的(纯数学构造、底层硬件),明说"这命题下不了生活的水",不硬测。
第二步,押未来——按命题往前推:X 条件下,该看到 Y。三种形态,至少押一注:
押注要敢错——写成能被打脸的样子:有条件,有可观察的结果。打不了脸的("未来会更重视 X")删掉。命题真推不出任何预测,直说——推不出预测的命题多半还没立住,这本身就是个发现。
这一节管"信不信",下一节「启发」管"用不用"。注是押给世界开奖的,启发是今天就动手的——别把注写成启发。
落点在"能用",不在"能想"。给出"这意味着你可以___",而非"这让我们重新思考___"。听完故事,听众要带走一件能动手的事。
用三个视角试探连接,命中展开,没命中跳过,全没命中说「没有」:
逐条扫红线。额外检查:
故事流自查(红线 12 的兜底):
列修改清单确认后生成文件。
按 Denote 规范获取时间戳,读 references/template.org,写入 ~/Documents/notes/。
tools
把 ~/.claude/skills/ljg-* 里所有更新过的 skills 同步到 github repo (ljg-skills),先推 master 分支(org-mode 输出风格),再切 md 分支(markdown 输出风格)做基础 markdown 化后推。Use when user says '/ljg-push', 'push skills', '推送 skills', '同步 skills', 'sync ljg', or whenever ljg-* skills get updated and need shipping. NOT FOR pushing non-ljg skills or arbitrary git repos.
testing
拆一本书,以「问题」为轴心走一条线。五件事:作者在答什么问题(问题),这个问题之前各流派/社会共识怎么答(零点),作者带来什么独特洞见——公式/理论框架/模型/概念四选一——相对共识挪动了什么(位移/delta),落成哪句结论(落点),最后萃一个 takeaway 作为精神内核(行囊)。收尾画一张 ASCII 参考系图(千脑智能式):各流派、旧共识、作者钉到同一张图的位置上,delta 是图上一段看得见的距离,再走两步做预测——看懂这本书在认知史里挪动了哪一步,还能拿它预测书外的新事。Use when user says '拆书', '拆这本', '分析这本书', '这本书在讲什么', '上帝之眼看这本书', '压缩一本书', 'book', or shares a book name wanting structural analysis. NOT FOR 章节摘要(用 Fabric extract_wisdom)、论文(用 ljg-paper)、单一观点深钻(用 ljg-think)、一个领域降秩(用 ljg-rank).
testing
给一个领域,找出背后真正撑着它的几根独立的力。十几个现象砍到不可再少的生成器——砍完能把现象一个个生回来,才算数。Use when user says '降秩', '找秩', '秩是什么', '这个领域靠什么撑着', '背后是什么', or wants to decompose any domain to its irreducible generators.
testing
信息提问机。给一篇文章/论文/书,把核心观点抽成 Q-A 对——Question 切要害,不教科书;Answer 简洁清晰,有形式化收口,逻辑链完整。读者顺 Q 链走过,每个 A 砸下一枚钉子,复现作者整套推理。Use when user says '问答', 'Q&A', 'QA', '提问', '抽取问题', '/ljg-qa', or shares an article/paper/book and asks for Q-A extraction. Triggers when the user wants ideas extracted not as a summary but as a sequence of incisive questions with answered. NOT FOR FAQ generation, glossary creation, or comprehension quizzes — this is intellectual scaffolding, not study aids.