CANN/ops-nn Ascend量化V2算子

张

张建站

2026/5/11 12:51:35

10分钟阅读

AscendQuantV2【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理系列产品√Atlas A2 训练系列产品/Atlas A2 推理系列产品√Atlas 200I/500 A2 推理产品×Atlas 推理系列产品√Atlas 训练系列产品×Kirin X90 处理器系列产品√Kirin 9030 处理器系列产品√功能说明算子功能对输入x进行量化操作支持设置axis以指定scale和offset对应的轴scale和offset的shape需要满足和axis指定x的轴相等或1。axis当前支持设置最后两个维度。计算公式sqrt_mode为false时计算公式为$$ y round((x * scale) offset) $$sqrt_mode为true时计算公式为$$ y round((x * scale * scale) offset) $$参数说明参数名输入/输出/属性描述数据类型数据格式x输入需要执行量化的输入对应公式中的x。FLOAT16、FLOAT32、BFLOAT16NDscale输入量化中的scale值对应公式中的scale。FLOAT16、FLOAT32、BFLOAT16NDoffset可选输入反量化中的offset值对应公式中的offset。FLOAT16、FLOAT32、BFLOAT16NDsqrt_mode可选属性指定scale参与计算的逻辑对应公式中的sqrtMode。默认值为false。BOOL-round_mode可选属性指定cast到int8输出的转换方式。支持取值roundceiltruncfloor。默认值为round。STRING-dst_type可选属性指定输出的数据类型。默认值为DT_INT8。INT-axis可选属性指定scale和offset对应x的维度。默认值为-1。INT-y输出表示AscendQuantV2的结果输出y对应公式中的y。shape与输入x的shape一致。INT8、INT4、HIFLOAT8、FLOAT8_E5M2、FLOAT8_E4M3FNNDAtlas 推理系列产品数据类型输入Tensor数据类型不支持BFLOAT16。输出Tensor数据类型仅支持INT8。round_mode支持取值roundceiltruncfloor。dst_type支持取值2表示INT8。axis只支持指定x的最后一个维度假设输入x维度是xDimNumaxis取值是-1或xDimNum-1。Atlas A2 训练系列产品/Atlas A2 推理系列产品、 Atlas A3 训练系列产品/Atlas A3 推理系列产品输出Tensor数据类型仅支持INT8、INT4。dst_type支持取值229分别表示INT8、INT4。axis支持指定x的最后两个维度假设输入x维度是xDimNumaxis取值范围是[-2-1]或[xDimNum-2xDimNum-1]。Ascend 950PR/Ascend 950DT round_modedst_type表示FLOAT8_E5M2或FLOAT8_E4M3FN时只支持round。dst_type表示HIFLOAT8时支持round和hybrid。dst_type表示其他类型时支持roundceiltrunc和floor。axis支持指定x的最后两个维度假设输入x维度是xDimNumaxis取值范围是[-2-1]或[xDimNum-2xDimNum-1]。Kirin X90/Kirin 9030 处理器系列产品:x、scale、offset不支持BFLOAT16y数据类型不支持INT4、HIFLOAT8、FLOAT8_E5M2、FLOAT8_E4M3FN。约束说明无调用说明调用方式样例代码说明aclnn接口test_aclnn_ascend_quant通过aclnnAscendQuant接口方式调用AscendQuantV2算子。aclnn接口test_aclnn_ascend_quant_v3通过aclnnAscendQuantV3接口方式调用AscendQuantV2算子。图模式-通过算子IR构图方式调用AscendQuantV2算子。【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

从AutoCAD草图到Ansys分析：复杂截面惯性矩的‘一条龙’实战流程

从AutoCAD草图到Ansys分析：复杂截面惯性矩的‘一条龙’实战流程在工程结构设计中，复杂截面的力学特性计算往往是连接CAD设计与CAE分析的关键环节。许多工程师都曾遇到过这样的困境：在AutoCAD中精心绘制了异形截面，却在转入Ansys进…...

2026/5/11 12:49:54 阅读更多 →

终极免费Windows风扇控制指南：FanControl完全配置教程

终极免费Windows风扇控制指南：FanControl完全配置教程【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/fa…...

2026/5/11 12:49:32 阅读更多 →

科技早报｜2026年5月11日：AI Agent 开始补验证、分工和落地这三道工程题

科技早报｜2026年5月11日：AI Agent 开始补验证、分工和落地这三道工程题一句话导读：5 月 11 日这篇科技早报不追“谁又发了一个更大的模型”，而看 AI agent 和企业协作真正要进生产前，平台厂商正在补哪些硬能力。GitHu…...

2026/5/11 12:48:32 阅读更多 →

4月28日隐喻“鲸鱼开眼”，DeepSeek识图模式灰度上线，迈入图文交互时代！

4月28日，DeepSeek多模态团队研究员推文隐喻“鲸鱼开眼”，次日开启“识图模式”灰度内测，5月初大范围开放。该模式有亮点也有短板，标志其迈入图文交互时代。事件回顾4月28日，DeepSeek多模态团队研究员陈小康在X平台推文…...

2026/5/10 0:06:14 阅读更多 →

AI赋能高能物理：图神经网络与生成式模型在粒子径迹重建与模拟中的应用

1. 项目概述：当AI遇见高能物理的“显微镜”电子离子对撞机（EIC），被誉为探索物质深层结构的下一代“超级显微镜”。它不像我们熟悉的LHC那样让质子对撞，而是让高能电子去轰击质子或重离子，其核心目标是精确“…...

2026/5/10 0:08:27 阅读更多 →

A/B 测试前后的合成控制样本

原文：towardsdatascience.com/synthetic-control-sample-for-before-and-after-a-b-test-683bac36ffc1 简介 A/B 测试非常强大。我喜欢这种实验，因为它让我们能够比较结果，并确定某物是否比另一物表现更好。 A/B 测试有一个特定类型&#x…...

2026/5/11 2:26:03 阅读更多 →