skills/Ascend_Model_Verifier/SKILL.md
# Ascend Model Verifier ## Skill Metadata - **Skill Name**: Ascend Model Verifier - **Version**: 1.0.0 - **Category**: DevOps / AI Infrastructure - **Target Platform**: Huawei Ascend NPU - **Skill Path**: `./skills/Ascend_Model_Verifier` ## Skill Goal 自动、持续地发现、验证、归档开源大模型在昇腾NPU上的适配情况,构建一个可运行的昇腾模型生态知识库。 ## Core Design Principles 采用多Agent协作、解耦架构。每个Agent负责单一职责,通过文件系统(特定路径下的脚本、列表、结果文件夹)和状态(如文件存在与否)进行通信与协同。 ## Environment Requirements - **Hardware**: Ascend NPU (910B/C series) - **vLLM Version
npx skillsauth add holyorevil/ascend-model-agent-plugin skills/Ascend_Model_VerifierInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
./skills/Ascend_Model_Verifier自动、持续地发现、验证、归档开源大模型在昇腾NPU上的适配情况,构建一个可运行的昇腾模型生态知识库。
采用多Agent协作、解耦架构。每个Agent负责单一职责,通过文件系统(特定路径下的脚本、列表、结果文件夹)和状态(如文件存在与否)进行通信与协同。
modelscopehuggingface_hubrequestsbeautifulsoup4Ascend_Model_Verifier/
├── SKILL.md # 本技能定义文件
├── scripts/ # 各Agent所需脚本
│ ├── crawler_huggingface.py # Agent1: HF爬虫
│ ├── crawler_modelscope.py # Agent1: ModelScope爬虫
│ ├── merge_model_lists.py # Agent1: 列表合并
│ ├── download_model.py # Agent2: 模型下载
│ ├── run_vllm_benchmark.py # Agent3: vLLM验证
│ ├── check_npu_status.py # Agent3: NPU状态检查
│ ├── generate_adaptation_guide.py # Agent4: 适配指南生成
│ ├── generate_error_log.py # Agent4: 错误日志生成
│ ├── archive_and_upload.py # Agent5: 归档上传
│ └── coordinator.py # 总协调器
├── reference/ # 参考文档
│ ├── features.md # 功能特性文档
│ ├── deployment.md # 部署指南
│ ├── models.md # 模型部署示例
│ ├── quantization.md # 量化指南
│ ├── troubleshooting.md # 故障排除
│ └── faq.md # 常见问题
├── results/ # 验证结果目录
│ └── <model_name>/ # 各模型结果
└── downloaded_models/ # 下载的模型权重
职责: 从HuggingFace和ModelScope平台爬取最新的热点模型列表。
职责: 从热点列表中筛选可验证的模型,并下载第一个待验证的模型。
筛选规则:
职责: 在华为昇腾设备上使用vLLM进行基准测试验证。
职责: 根据验证结果生成适配指南或错误日志。
职责: 将单个模型的完整验证结果归档并上传至代码仓库。
# 单次运行
python scripts/coordinator.py --once
# 持续运行
python scripts/coordinator.py --continuous
| 标记文件 | 创建者 | 含义 |
|---------|-------|------|
| download.complete | Agent2 | 模型下载完成 |
| validation.complete | Agent3 | 验证完成 |
| documentation.complete | Agent4 | 文档生成完成 |
data-ai
昇腾(Ascend) NPU 上 Triton 算子深度性能优化技能(Skill),致力于实现用户要求的 Triton 算子性能提升。核心技术包括但不限于 Unified Buffer (UB) 容量规划、多 Tokens 并行处理、MTE/Vector 流水并行、mask(掩码)优化等。当用户提及以下内容时,务必触发此技能(Skill):昇腾(Ascend)NPU 上 Vector 类 Triton 算子性能优化。
development
从模型仓库链接读取 README 文档。当用户想要从模型仓库链接(如 https://ai.gitcode.com/Ascend-SACT/Qwen3.5-27B-A2-Vllm-Ascend)获取部署文档、使用说明或任何仓库内容时触发此 skill。使用此 skill 来获取仓库的 README、文档内容、部署命令等。
tools
Entry point for Ascend NPU inference toolchain. Use when running vLLM on Ascend/NPU, quantizing models with msmodelslim, or debugging NPU errors.
tools
GPU代码到昇腾NPU适配审查专家。当用户需要将GPU上的代码(特别是深度学习、模型推理相关)迁移到华为昇腾NPU时,必须使用此skill进行全面审查。此skill能识别GPU到NPU迁移的堵点、编写适配脚本、生成验证方案,并输出完整的Markdown审查报告。触发场景包括:用户提到"NPU适配"、"昇腾迁移"、"GPU转NPU"、"Ascend"、"CANN"、"模型迁移"、"算子适配"等关键词,或者用户要求对GPU代码仓库进行审查并迁移到NPU平台。