skills/ascend-npu-driver-install/SKILL.md
能完成昇腾NPU驱动和固件安装部署,实现安装包正则匹配提取、按需添加可执行权限、Python+Shell双重包校验、系统依赖先验后装、适配CentOS/RHEL/Ubuntu/Debian系统,适用于昇腾NPU驱动和固件安装部署。
npx skillsauth add Ascend/agent-skills ascend-npu-driver-installInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
该技能为提供端到端自动化的NPU驱动和固件安装能力,覆盖从安装包校验到驱动生效验证的全流程,无需手动分步操作,严格遵循昇腾官方安装规范,适配主流Linux发行版。
chmod +x并二次校验赋权结果,避免权限问题导致安装失败;npu-smi原生命令验证驱动状态。将核心脚本check_package.py(Python包校验)和install_npu_driver.sh(Shell主安装)放在同一目录,本技能的根目录建议命名为ascend-npu-driver-install,与name字段保持一致。
指定的安装包文件夹内仅存放1个符合昇腾官方命名格式的驱动.run包和1个固件.run包,无其他无关文件,包名格式严格遵循:
Ascend-hdk-<chip_type>-npu-driver_<version>_linux-<arch>.runAscend-hdk-<chip_type>-npu-firmware_<version>.runsudo -i命令切换;进入脚本所在的技能根目录,执行以下命令为两个核心脚本赋予可执行权限:
chmod +x ./scripts/install_npu_driver.sh ./scripts/check_package.py
命令格式:./scripts/install_npu_driver.sh <NPU包文件夹完整路径> <驱动运行用户>
推荐示例(使用root用户进行安装):
./scripts/install_npu_driver.sh /opt/ascend/npu_pkgs root
安装完成后脚本会弹出交互式重启提示,NPU驱动和固件生效必须重启系统,无重启则无法完成驱动加载:
y:系统立即重启,完成NPU驱动内核加载;n:跳过立即重启,后续需手动执行reboot命令完成系统重启。系统重启后,执行昇腾官方原生命令验证 NPU 驱动加载状态:
npu-smi info
安装成功标识:命令输出内容包含NPU 芯片型号、Driver Version(驱动版本)、Firmware Version(固件版本),无任何报错信息。
check_package.py(Python 包校验脚本) 由 Shell 主脚本自动调用,无需手动执行,核心完成以下包校验工作: 检查安装包所在文件夹是否存在; 按昇腾官方正则匹配驱动 / 固件包,校验包数量唯一性; 验证包为有效文件(非目录); 检测包的可执行权限,无权限时给出警告提示; 输出校验通过的驱动 / 固件包完整绝对路径,供 Shell 脚本调用。 install_npu_driver.sh(Shell 主安装脚本) 技能核心执行脚本,按固定流程自动化运行,全程无需人工干预,执行流程为:ROOT/Python3环境检查 → 包路径正则提取 → 包可执行权限按需赋权 → Python包二次校验 → 运行用户/组自动创建 → 系统依赖先验后装 → NPU驱动安装 → NPU固件安装 → 交互式重启确认 → npu-smi原生验证
testing
Kubernetes 集群健康检查与安全修复 — 诊断问题,用户确认后执行修复
tools
昇腾NPU CANN Toolkit+Kernels+NNAL安装部署技能。支持从官网下载run包安装和从Docker镜像提取两种方式,覆盖驱动检查、包下载、安装、环境变量配置与验证全流程。当用户需要安装CANN全套组件或指定版本CANN到自定义路径时调用。
development
编译 ATB (Ascend Transformer Boost) 测试框架。当用户需要编译 ATB 测试框架、 运行 CSV 测试、或构建 atb_test_framework 时调用。支持全量编译(含第三方依赖克隆与源替换) 和增量编译两种模式。需在 Docker 容器内配合 CANN 环境执行。
databases
ATB OPS→ACLNN 迁移标准化工作流主模板。整合前置学习、设计文档生成、CSV用例设计、 实际迁移、编译验证、测试验证全流程,提供明确的阶段 Gates 和用户确认机制。