Ascend

91 verified skills647 total stars

atb-aclnn-operator-migration

自动执行 ATB 算子到 ACLNN 的迁移操作，在 910B/950 设备上启用 ACLNN 加速。支持参数映射、ACLNN Runner 实现、设备检测切换和功能/性能验证全流程。

atb-aclnn-operator-replacement-designer

自动生成 ATB 到 ACLNN 算子替换的详细设计文档。接收用户提供的 ATB 和 ACLNN 接口文档链接，输出包含参数映射、开发自测、风险评估的 7 章结构化设计文档。 TRIGGER when: 用户需要将 ATB 算子替换为 ACLNN 算子并撰写设计文档。

content-media13

skills/ascendc-operator-code-gen

--- name: ascendc-operator-code-gen description: 根据设计文档生成 AscendC 算子完整代码实现并完成框架适配。TRIGGER when: 设计文档已完成，需要生成 op_host/op_kernel 代码、注册到 PyTorch 框架、编译测试。关键词：代码生成、op_host、op_kernel、tiling、kernel、框架适配、算子注册。 --- # AscendC 算子代码生成与框架适配根据设计文档生成 op_host + op_kernel 代码，注册到 PyTorch 框架，调用 `ascendc-operator-compile-debug` skill 完成编译安装和精度测试。 **前置条件**: 设计文档 `ascend-kernel/csrc/ops/<op_name>/design.md` 已就绪，目录结构已创建。 ## 工作流程总览 ``` 读取设计文档 → 加载 reference → 选择模板 → 生成 op_host + op_kernel → 框架适配 (ops.h + regi

development13

atb-nnal-installer

昇腾 NPU NNAL（ATB 加速库）安装技能。依赖 cann-operator-env-config 提供 Toolkit+Kernels 环境，本技能仅负责 NNAL 包的安装、环境变量配置与验证。

tools13

ascend-transformer-boost

昇腾 Transformer 加速库（ATB）核心技能集索引（Index Skill）。整合 8 大核心技能：CANN 安装部署、ATB 测试框架编译、 ATB→ACLNN 算子替换设计文档生成、ATB→ACLNN 算子迁移，覆盖昇腾 NPU 开发全链路。

tools13

ascendc-operator-design

完成AscendC算子设计 - 帮助用户完成算子的架构设计、接口定义和性能规划。当用户提到算子设计、算子开发、tiling策略、内存规划、AscendC kernel设计、两级tiling、核间切分、核内切分时，使用此skill。

content-media13

atb-debug-guide

ATB 调试指南技能。当用户遇到 ATB 算子测试问题、需要分析错误原因、或需要了解 ATB 环境配置时调用此技能。覆盖：环境配置问题、ABI版本不匹配、内存错误、CSV测试失败、ACLNN接口问题等常见场景。

development13

atb-csv-tester

运行 ATB (Ascend Transformer Boost) CSV 测试。当用户需要执行 CSV 格式的 ATB 测试用例、验证算子正确性、或运行任何ATB下的 CSV 测试文件时调用此技能。需配合 CANN 环境和已编译的 ATB 测试框架使用。

testing13

ascendc-operator-performance-optim

排查并优化 Ascend C 算子性能。当用户开发、审查或优化 Ascend C kernel 算子时使用，或当用户提及 Ascend C 性能优化、算子优化、tiling、流水、搬运、内存优化、NPU/昇腾等关键词时触发。

tools13

triton-operator-env-config

在 Ascend 昇腾平台上校验并构建triton算子开发所需环境,包括CANN、Python/torch/torch_npu/triton-ascend依赖和PATH环境变量等设置。当用户需要配置triton算子开发环境、检查CANN/torch/triton-ascend安装、验证环境是否可用时使用。

development13

triton-operator-performance-eval

评估 Ascend NPU 上 Triton 算子性能。使用 msprof/msprof op 采集性能数据，诊断 Memory-Bound/Compute-Bound 瓶颈，测量硬件利用率，生成性能报告。

tools13

triton-operator-doc-gen

为昇腾 NPU Triton 算子生成标准化接口文档。当用户需要为算子创建 README、生成 API 文档、编写产品支持表、整理参数说明时使用。关键词：文档生成、doc generation、README、接口文档、API documentation。

development13

triton-operator-code-gen

根据 Ascend NPU 算子设计文档（或直接需求）生成 Triton kernel 代码。当用户需要实现 Triton 算子、将设计文档转为可执行代码时使用。核心产出：kernel 代码 + 基本正确性测试。关键词：Triton kernel、算子实现、代码生成、code generation。

development13

triton-operator-design

生成适用于 Ascend NPU 的 Triton 算子需求文档。当用户需要设计新的 Triton 算子、编写算子需求文档、进行算子性能优化设计时使用。核心产出：功能定义、API 接口、Tiling 策略、Kernel 实现方案。

development13

triton-operator-performance-optim

优化 Ascend NPU 亲和的 Triton 算子性能。解决 UB 溢出、提高 Cube 利用率、Tiling 策略设计。关键词：性能优化、performance optimization、tiling、UB。

tools13

triton-operator-dev

昇腾 Triton 算子全流程开发编排。当用户需要从零开发 Triton 算子、进行端到端开发流程、或不确定该用哪个子 skill 时使用。自动编排：环境配置→需求设计→代码生成→静态检视→精度验证→性能评估→性能优化。关键词：全流程、开发编排、端到端、workflow orchestration。

development13

atb-csv-testcase-generator

ATB CSV 测试用例生成技能。当用户需要为 ATB 算子创建 CSV 格式的泛化测试用例时调用此技能。覆盖：正例设计、反例设计、性能测试用例、CSV 格式规范。

testing13

atb-ops-to-aclnn-migration-workflow

ATB OPS→ACLNN 迁移标准化工作流主模板。整合前置学习、设计文档生成、CSV用例设计、实际迁移、编译验证、测试验证全流程，提供明确的阶段 Gates 和用户确认机制。

databases13

atb-testframework-build

编译 ATB (Ascend Transformer Boost) 测试框架。当用户需要编译 ATB 测试框架、运行 CSV 测试、或构建 atb_test_framework 时调用。支持全量编译（含第三方依赖克隆与源替换）和增量编译两种模式。需在 Docker 容器内配合 CANN 环境执行。

development13

triton-operator-precision-eval

Triton 算子精度评估。与 PyTorch 参考实现对比，自动计算误差指标，生成标准化精度报告。关键词：精度测试、precision evaluation、精度报告、accuracy verification。

testing13

cann-nnal-installer

昇腾NPU CANN Toolkit+Kernels+NNAL安装部署技能。支持从官网下载run包安装和从Docker镜像提取两种方式，覆盖驱动检查、包下载、安装、环境变量配置与验证全流程。当用户需要安装CANN全套组件或指定版本CANN到自定义路径时调用。

tools13

security-code-review

多语言安全代码审查 (Security Code Review)。对 Python、C++、Shell、Markdown 文件进行系统性安全漏洞检测与修复指导。覆盖 OWASP Top 10、CWE Top 25、CERT 安全编码标准。当用户提及以下内容时，务必使用此技能：安全审查、安全代码审查、security review、code review 中的安全检查、漏洞扫描、安全合规检查（CWE/CERT/OWASP）、编写安全代码、检查代码安全性、推理服务安全审计、多模态 Token 安全校验、JSON 嵌套深度攻击防护。即使用户没有明确说'安全审查'，只要涉及代码安全性评估、漏洞检测、安全最佳实践，都应触发此技能。

development13

k8s-check-fix

Kubernetes 集群健康检查与安全修复 — 诊断问题，用户确认后执行修复

testing13

triton-operator-code-review

静态检视 Triton 算子代码质量（Host+Device 侧），面向 Ascend NPU。发现潜在 bug、API 误用和性能隐患。仅关注静态代码分析。关键词：code review、代码检视、静态分析。

development13

ascendc-operator-project-init

初始化 AscendC 算子工程并创建可编译的算子骨架。触发场景：(1) 用户要求创建新算子；(2) 关键词：ascendc算子、新建算子、算子目录、算子初始化；(3) 需要基于 ascend-kernel 模板快速落地。本 skill 不只建目录，还输出“可继续开发”的标准文件与检查清单。

tools5

ascendc-operator-testcase-gen

完成AscendC算子验证用例生成 - 帮助用户完成testcase设计。当用户提到用例设计、泛化用例生成、算子标杆、UT用例、精度用例、性能用例时，使用此skill。

testing5

ascend-docker

Create Docker containers for Huawei Ascend NPU development with proper device mappings and volume mounts. Use when setting up Ascend development environments in Docker, running CANN applications in containers, or creating isolated NPU development workspaces. Supports privileged mode (default), basic mode, and full mode with profiling/logging. Auto-detects available NPU devices.

Ascend

atb-aclnn-operator-migration

atb-aclnn-operator-replacement-designer

skills/ascendc-operator-code-gen

atb-nnal-installer

ascend-transformer-boost

ascendc-operator-design

atb-debug-guide

atb-csv-tester

ascendc-operator-performance-optim

triton-operator-env-config

triton-operator-performance-eval

triton-operator-doc-gen

triton-operator-code-gen

triton-operator-design

triton-operator-performance-optim

triton-operator-dev

atb-csv-testcase-generator

atb-ops-to-aclnn-migration-workflow

atb-testframework-build

triton-operator-precision-eval

cann-nnal-installer

security-code-review

k8s-check-fix

triton-operator-code-review

ascendc-operator-project-init

ascendc-operator-testcase-gen

ascend-docker

ascend-inference-repos-copilot

ascend-mmlab-install-suite

ascend-npu-driver-install

ascend-profiling-anomaly

auto-bug-fixer

auto-develop-test-gen

catlass-operator-code-gen

catlass-operator-design

catlass-operator-dev

catlass-operator-performance-optim

code-comprehension

modelscope-cli

ssh-dev-suite/debug

ssh-dev-suite/deploy

ascend-detectron2-install

ascend-model-migration

skills/mindspeed-llm-auto-ut-skills/skills/generate-unit-test

hccl-test

megatron-change-analyzer

megatron-commit-tracker

megatron-impact-mapper

mindspeed-fsdp2-config-migration

mindspeed-fsdp2-data-migration

mindspeed-fsdp2-model-migration

mindspeed-fsdp2-verification

ascend-mmcv-install

ascend-mmdet-install

ascend-mmdet3d-install

model-migration

model-training

npu-adapter-reviewer

pytest-writer

run-mindspeed-llm-test

swanlab-setup

unittest-writer

vector-triton-ascend-ops-optimizer

verl-async-dapo

verl-deploy

vllm-ascend-deploy

skills/vLLM-ascend_FAQ_Generator

ssh-dev-suite/connect

skills/ascendc-operator-compile-debug

atc-model-converter

ssh-dev-suite

python-refactoring

simple-vector-triton-gpu-to-npu

npu-smi

msverl-daily-regression-triage

mindspeed-fsdp2-migration-main

coverage

cann-operator-env-config

ascendc-operator-doc-gen