skills/catlass-operator-design/SKILL.md
将用户基于CATLASS开发算子的需求转变为具体的设计文档
npx skillsauth add Ascend/agent-skills catlass-operator-designInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
需求分析 → 阅读 catlass 仓库 → 组件选型 → 输出设计文档
| 检查项 | 说明 |
|--------|------|
| catlass 仓库 | 须在 OPS_PROJECT_ROOT 下可访问 catlass/(含 include/、examples/) |
| 必读参考 | 设计前必须阅读本 skill 的 references/ 文件 |
| 文件 | 用途 | |------|------| | design-document.md | 设计文档模板 | | matmul-templates.md | 模板清单与选型指南 | | epilogue-components.md | Epilogue 组件分类与组合模式 | | custom-epilogue.md | 自定义 Epilogue 契约 |
op_name(snake_case)必须包含子串 catlass,例如:catlass_matmul_add、catlass_fused_gemm_biasmatmul_add、gemm_add)CatlassMatmulAdd、ops/catlass_matmul_add/NEVER:使用不含 catlass 的算子名定稿设计;把 example 整份照抄;设计文档中写大量代码块;在信息不足时臆测需求
ALWAYS:算子名含 catlass,目录名与类名一致映射;条件不明则追问;设计前存在 catlass 仓库并阅读其文档与代码;设计文档用选型表格描述组件
用户可能直接说出需求,也可能不说。执行本 skill 时:若认为信息不足,则继续追问。
需确认的信息:op_name(须含 catlass)、功能要点、I/O 与 dtype、布局、目标 SoC、参考 example(如有)、约束条件。
op_name:须含 catlassexamples/、include/ 下的文档与代码examples/ 中按功能找相似示例,在设计文档中写明:选中的 example 路径、选型理由catlass/include/catlass/epilogue/tile/ 中检索;无现成 Tile 时按 custom-epilogue.md 先写设计契约选型结果用概念表格记录在设计文档中,不写代码。
设计文档须显式写出选型表格:ArchTag、BlockMmad(L1/L0 TileShape、数据类型)、BlockEpilogue(各环节 Tile/Block 组件)、BlockScheduler、Kernel 类型。
设计文档须为独立 Markdown 文件,命名建议 design_<op_name>.md,存放于 USER_OP_PROJECT 或用户指定路径。
catlass,snake_case 目录名与 CamelCase 类名一致| 文件 | 用途 | |------|------| | design-document.md | 设计文档模板与章节规范 | | matmul-templates.md | 模板清单与选型指南 | | epilogue-components.md | Epilogue 组件分类与选型 | | custom-epilogue.md | 自定义 Tile Epilogue 的设计契约 | | catlass/examples/ | 开发形式与多种模板参考 | | catlass/docs/3_API/gemm_api.md | Gemm API 分层模型、组件对照表 |
testing
Kubernetes 集群健康检查与安全修复 — 诊断问题,用户确认后执行修复
tools
昇腾NPU CANN Toolkit+Kernels+NNAL安装部署技能。支持从官网下载run包安装和从Docker镜像提取两种方式,覆盖驱动检查、包下载、安装、环境变量配置与验证全流程。当用户需要安装CANN全套组件或指定版本CANN到自定义路径时调用。
development
编译 ATB (Ascend Transformer Boost) 测试框架。当用户需要编译 ATB 测试框架、 运行 CSV 测试、或构建 atb_test_framework 时调用。支持全量编译(含第三方依赖克隆与源替换) 和增量编译两种模式。需在 Docker 容器内配合 CANN 环境执行。
databases
ATB OPS→ACLNN 迁移标准化工作流主模板。整合前置学习、设计文档生成、CSV用例设计、 实际迁移、编译验证、测试验证全流程,提供明确的阶段 Gates 和用户确认机制。