skills/clipping/SKILL.md
将网页文章(含微信公众号等 JS 渲染页面)保存为本地 Markdown 笔记。自动处理图片中的文字信息——对信息图、表格截图等使用 PaddleOCR 提取中英文文本并重构为 Markdown 表格。
npx skillsauth add kanlac/agent-steroids clippingInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
微信公众号等 JS 渲染页面,WebFetch 会返回空内容。必须通过有头浏览器(CDP Chrome)加载页面,等待渲染完成后提取正文、标题、作者、发布日期和图片 URL。
提取时注意区分正文内容和页面装饰元素(广告、推荐阅读、底部导航等)。
部分文章的主要信息以图片形式呈现——信息图、排行榜、对比表格等。这类图片通常有明显特征:尺寸较大(特别是高度远超普通配图)、位于正文核心位置。
识别到这类图片后,不能只插入图片链接,需要提取其中的文字信息。
对包含文字/表格的关键图片,使用 PaddleOCR(PP-OCRv5,lang='ch')提取文本。
环境注意事项:
predict() 方法,不是 ocr();save_path 参数仅限 CLI 模式PADDLE_PDX_DISABLE_MODEL_SOURCE_CHECK=True 跳过连通性检查,避免长时间卡住超长图片处理: 图片高度超过 4000px 时,OCR 精度会下降。将图片按 ~2000px 高度分段裁剪后逐段识别,效果更好。
表格结构重建: OCR 返回的是带坐标的文本块列表。利用 x 坐标区分列、y 坐标判断行归属,可以重建表格结构。典型策略:用左侧文本(如公司名、行标题)作为行锚点,右侧文本作为对应内容。具体的列分界阈值需要根据实际图片布局调整。
将文章正文和 OCR 提取的表格内容合并为一份 Markdown 文件:
保存到用户指定的目录。文件名从文章标题生成,去除特殊字符。若用户未指定目录,询问保存位置。
tools
Turn a YouTube link into a polished single-file bilingual (Chinese + original) transcript reading page. Use when the user gives a YouTube URL and asks to "转录" "做转录稿" "生成转录页面" "中英对照" "bilingual transcript" "transcribe this video", or wants a readable HTML transcript with clickable timestamps, chapter navigation, highlighted key points, and proper-noun annotations. Fetches captions + chapters via yt-dlp, the agent translates and curates, then a script renders the HTML.
development
Use when a user asks the agent to "learn" from a file, example, correction, failed workflow, or feedback and persist that learning into skills or agent instructions. Guides semantic skill refactoring: extract the transferable behavior, update the owning skill so it becomes clearer and easier to execute, avoid append-only note dumping, and decide when not to create new reference files.
development
以「配置即代码」的方式管理、调试 Clash Verge Rev(mihomo 内核)的配置,并实现不依赖 GUI 的配置更新。涵盖:哪些字段扩展脚本能改 / 不能改(external-controller、secret、端口被内核接管)、改了为什么不生效、如何在纯命令行下让配置重新生成并生效、mihomo external controller 这个内核 RESTful API 的用法、用 external-ui 自托管 Web 面板、以及判断流量「走没走代理 / 命中哪条规则」的排查方法。只要用户在改 Clash Verge / mihomo 的扩展脚本(script)、扩展配置(merge)、订阅规则、external-controller / secret / 端口、或抱怨「clash 配置改了不生效」「规则不命中」「远程连不上面板」「想自动化更新代理配置」,就应该用这个 skill。
data-ai
Configure and manage Telegram-connected Claude agents with heartbeat scheduling on macOS. Use when the user wants to "set up Telegram agent", "add heartbeat", "configure Telegram channel", "管理 Telegram agent", "配置心跳", "添加定时任务", "Telegram 多 agent", "配置 Telegram", "添加 Telegram agent", "给 Telegram bot 创建身份", "设置定时任务", "新增定时任务", "每天X点执行Y", "schedule a task", "run this automatically", "set up a cron job", or encounters Telegram polling conflicts, 409 Conflict, file upload failures through proxy, or needs to add recurring/periodic automated task execution for Claude agents.