/SKILL.md
# WeChat 文档去重 Skill > 基于 Piotr Kołaczkowski (fclones作者) 的去重算法思想设计 ## 功能 扫描微信文件夹中的重复文档(PDF、Word),通过**内容指纹**识别重复文件,将重复项移动到隔离文件夹等待用户确认删除。 ## 触发词 - `微信去重` - `清理微信重复文件` - `wechat dedup` ## 工作流程 1. **扫描**:遍历微信文件夹,找出所有 PDF 和 Word 文档 2. **指纹计算**:对每个文件计算内容指纹(文件大小 + MD5哈希) 3. **分组**:将相同指纹的文件归为一组 4. **保留策略**:每组保留**最早创建**的文件 5. **隔离**:将重复文件移动到 `~/微信重复文件_待删除/` 文件夹 6. **报告**:生成去重报告,显示节省的空间 ## 使用方法 ``` /wechat-dedup ``` 或直接说:`帮我清理微信的重复文件` ## 配置 | 参数 | 默认值 | 说明 | |------|--------|------| | 扫描路径 | 微信
npx skillsauth add rolandwonglonam/wechat-dedup wechat-dedupInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
基于 Piotr Kołaczkowski (fclones作者) 的去重算法思想设计
扫描微信文件夹中的重复文档(PDF、Word),通过内容指纹识别重复文件,将重复项移动到隔离文件夹等待用户确认删除。
微信去重清理微信重复文件wechat dedup~/微信重复文件_待删除/ 文件夹/wechat-dedup
或直接说:帮我清理微信的重复文件
| 参数 | 默认值 | 说明 | |------|--------|------| | 扫描路径 | 微信文件夹 | 自动检测 | | 文件类型 | PDF, DOC, DOCX | 可扩展 | | 隔离文件夹 | ~/微信重复文件_待删除/ | 30天后用户自行删除 | | 保留策略 | 最早创建 | 按创建时间 |
使用 Python 脚本 dedup.py 执行核心逻辑:
hashlib 计算 MD5 指纹PyPDF2 读取 PDF 内容(可选)python-docx 读取 Word 内容(可选)python3 ~/.claude/skills/wechat-dedup/dedup.py
content-media
Summarize or extract text/transcripts from URLs, podcasts, and local files (great fallback for “transcribe this YouTube/video”).
content-media
QQBot 富媒体收发能力。使用 <qqmedia> 标签,系统根据文件扩展名自动识别类型(图片/语音/视频/文件)。
content-media
Summarize or extract text/transcripts from URLs, podcasts, and local files (great fallback for “transcribe this YouTube/video”).
content-media
QQBot 富媒体收发能力。使用 <qqmedia> 标签,系统根据文件扩展名自动识别类型(图片/语音/视频/文件)。