skills/triton-operator-precision-eval/SKILL.md
Triton 算子精度评估。与 PyTorch 参考实现对比,自动计算误差指标,生成标准化精度报告。关键词:精度测试、precision evaluation、精度报告、accuracy verification。
npx skillsauth add Ascend/agent-skills triton-operator-precision-evalInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
精度是算子正确性的底线。验证通过前不做性能优化。
test_common.validate_cmp() 比对,生成精度报告MANDATORY - READ ENTIRE FILE:编写测试前,完整阅读 scripts/test_common.py。
判定条件:MERE < 阈值 且 MARE < 10 × 阈值
| 数据类型 | 阈值 | MERE 上限 | MARE 上限 | |---------|------|----------|----------| | float16 | 2⁻¹⁰ ≈ 9.77e-4 | 9.77e-4 | 9.77e-3 | | float32 | 2⁻¹³ ≈ 1.22e-4 | 1.22e-4 | 1.22e-3 | | bfloat16 | 2⁻⁷ ≈ 7.81e-3 | 7.81e-3 | 7.81e-2 | | int8/uint8/int16/uint16/int32/uint32/int64/uint64 | 完全相等 | — | — | | bool | 完全相等 | — | — |
其中:
precision_report.md(Markdown 格式)precision_eval.pyexamples/ 目录下的示例脚本和报告格式testing
Kubernetes 集群健康检查与安全修复 — 诊断问题,用户确认后执行修复
tools
昇腾NPU CANN Toolkit+Kernels+NNAL安装部署技能。支持从官网下载run包安装和从Docker镜像提取两种方式,覆盖驱动检查、包下载、安装、环境变量配置与验证全流程。当用户需要安装CANN全套组件或指定版本CANN到自定义路径时调用。
development
编译 ATB (Ascend Transformer Boost) 测试框架。当用户需要编译 ATB 测试框架、 运行 CSV 测试、或构建 atb_test_framework 时调用。支持全量编译(含第三方依赖克隆与源替换) 和增量编译两种模式。需在 Docker 容器内配合 CANN 环境执行。
databases
ATB OPS→ACLNN 迁移标准化工作流主模板。整合前置学习、设计文档生成、CSV用例设计、 实际迁移、编译验证、测试验证全流程,提供明确的阶段 Gates 和用户确认机制。