CANN Qwen3-Next NPU算子扩展

张

张建站

2026/5/9 15:54:36

10分钟阅读

NpuOpsTransformerExt【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer简介 | Overview该目录包含用于Qwen3-Next 推理的 NPU 融合算子实现目前包括rmsnormgated融合算子Gated Delta Network (GDN)融合算子这些算子以 PyTorch Extension 的形式实现并在安装后注册到torch.ops命名空间中供框架调用。核心组件 | Core Components本模块主要包含以下关键组件gated_delta_net/op_dir/算子实现目录主要包含op_name.cpp算子调用文件。op_kernel/算子 Kernel 具体实现代码。gated_delta_net/op_dir/CMakeLists.txt算子编译配置文件。npu_ops_transformer_ext/npu_ops_transformer_ext/npu_ops_def.cpp算子接口注册文件。环境要求 | PrerequisitesPython ≥ 3.8CANN Ascend ToolkitPyTorch ≥ 2.1.0torch_npu (PyTorchAdapter)上述依赖的安装与环境配置请参考 Qwen3-Next README。安装步骤 | Installation进入算子目录安装依赖pip install -r requirements.txt从源码构建.whl包python -m build --wheel -n安装构建好的.whl包pip install dist/*.whl --force-reinstall --no-deps可选如果需要重新编译建议先清理编译缓存python setup.py clean算子调用 | Usage完成编译并安装.whl包后自定义算子会注册到torch.ops命名空间中可通过如下方式调用import torch import npu_ops_transformer_ext # 调用自定义算子 out torch.ops.npu_ops_transformer_ext.my_ops(input)其中npu_ops_transformer_ext为算子注册的 namespacemy_ops为具体算子名称在npu_ops_def.cpp中定义当前模块包含的算子示例torch.ops.npu_ops_transformer_ext.recurrent_gated_delta_rule(...) torch.ops.npu_ops_transformer_ext.mambav2_rmsnormgated(...)具体输入参数格式请参考对应算子的实现代码。【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

DAYU200开发板调试实战：用HDC命令搞定屏幕旋转、开机动画和系统应用卸载

DAYU200开发板深度定制指南：HDC命令实战技巧拿到一块全新的DAYU200开发板时，很多开发者都会遇到几个共性问题：屏幕方向不符合实际使用场景、开机动画千篇一律、系统预装应用占用宝贵存储空间。本文将带你用HDC命令链解决这三个痛点&#xff…...

2026/5/9 15:53:06 阅读更多 →

Saber框架：零样本视频生成技术解析与应用

1. Saber框架的核心价值解析在视频生成领域，传统方法通常需要大量标注数据才能训练出可用的模型。而Saber框架的突破性在于，它实现了"零样本"条件下的参考视频生成能力。这意味着我们不再需要针对每个特定场景收集海量训练数据，就能…...

2026/5/9 15:43:35 阅读更多 →

基于贝叶斯对抗风险分析的AI系统网络安全防护组合优化

1. 项目概述：当AI系统遇上“看不见的对手”在AI系统日益成为业务核心的今天，我们面临的威胁早已不是简单的病毒或脚本小子。攻击者变得像高明的棋手，他们不再追求一击必杀，而是通过一系列精心策划、相互关联的试探性攻击&#xff…...

2026/5/9 15:41:31 阅读更多 →

10分钟掌握NSC_BUILDER：Switch游戏文件管理终极指南

10分钟掌握NSC_BUILDER：Switch游戏文件管理终极指南【免费下载链接】NSC_BUILDER Nintendo Switch Cleaner and Builder. A batchfile, python and html script based in hacbuild and Nuts python libraries. Designed initially to erase titlerights encryption…...

2026/5/8 5:18:34 阅读更多 →

适合学校行政校内会议场景的，学校会议转行动项整理技巧

2026年多数学校都在推校内工作闭环管理，行政校内会议结束后，最头疼的就是从一堆零散讨论里整理出可落地的行动项，漏项、错记责任人、错过截止时间都是常事，还给后续工作埋坑，这里给你一套可直接落地的整理技巧。某区公…...

2026/5/7 21:34:19 阅读更多 →

Degrees of Lewdity汉化版终极完整指南：从零开始的中文化体验之旅

Degrees of Lewdity汉化版终极完整指南：从零开始的中文化体验之旅【免费下载链接】Degrees-of-Lewdity-Chinese-Localization Degrees of Lewdity 游戏的授权中文社区本地化版本项目地址: https://gitcode.com/gh_mirrors/de/Degrees-of-Lewdity-Chinese-Locali…...

2026/5/7 21:33:58 阅读更多 →