CANN/AMCT：量化感知训练配置参数说明

张

张建站

2026/7/8 14:56:50

10分钟阅读

量化感知训练配置参数说明【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct如果通过create_quant_retrain_config接口生成的config.json量化感知训练配置文件推理精度不满足要求则需要参见该章节不断调整config.json文件中的内容直至精度满足要求该文件部分内容样例请参见接口中的调用示例部分用户修改json文件时请确保层名唯一。配置文件中参数说明如下其中表9~表11的参数说明在手动调整量化配置文件时才会使用。表 2version参数说明作用控制量化配置文件版本号。类型int取值范围1参数说明目前仅有一个版本号1。推荐配置1必选或可选可选表 3batch_num参数说明作用控制量化感知训练推理阶段使用多少个batch的数据。类型int取值范围大于0参数说明如果不配置则使用默认值1建议校准集图片数量不超过50张根据batch的大小batch_size计算相应的batch_num数值。batch_num*batch_size为量化使用的校准集图片数量。其中batch_size为每个batch所用的图片数量。推荐配置1必选或可选可选表 4retrain_enable参数说明作用该层是否进行量化感知训练。类型bool取值范围true或false参数说明true该层需要进行量化感知训练。false该层不进行量化感知训练。推荐配置true必选或可选可选表 5retrain_data_config参数说明作用该层数据量化配置。类型object取值范围-参数说明包含如下参数algo量化算法选择默认是ulq_quantize。clip_max截断量化算法上限默认不选。clip_min截断量化算法下限默认不选。fixed_min截断量化算法最小值固定为0默认不选。dst_type用以选择INT8或INT4量化位宽默认为INT8。推荐配置-必选或可选可选表 6retrain_weight_config参数说明作用该层权重量化配置。类型object取值范围-参数说明包含如下参数algo量化算法选择默认是arq_retrainchannel_wise推荐配置-必选或可选可选表 7algo参数说明作用该层选择使用的量化算法。类型object取值范围-参数说明ulq_quantizeulq截断上下限量化算法。arq_retrainarq量化算法。推荐配置数据量化使用ulq_quantize权重量化使用arq_retrain。必选或可选可选表 8channel_wise参数说明作用是否对每个channel采用不同的量化因子。类型bool取值范围true或false参数说明true每个channel独立量化量化因子不同。false每个channel同时量化共享量化因子。推荐配置true必选或可选可选表 9fixed_min参数说明作用设置数据量化算法下限的开关。类型bool取值范围true或false参数说明true数据量化算法固定下限并且下限为0。false数据量化算法不固定下限。如果不选此项AMCT根据图的结构自动设置。如果选择此项并且网络模型量化层的前一层是relu层则该参数需要手动设置为true如果为非relu层则要手动设置为false。推荐配置不选此项必选或可选可选表 10clip_max参数说明作用数据量化算法上限。类型float取值范围clip_max0根据不同层activation的数据分布找到最大值max推荐取值范围为0.3*max~1.7*max参数说明截断上下限数据量化算法如果选择此项则固定算法截断上限。如果不选此项通过ifmr算法学习获取上限。推荐配置不选此项必选或可选可选表 11clip_min参数说明作用数据量化算法下限。类型float取值范围clip_min0根据不同层activation的数据分布找到最小值min推荐取值范围为0.3*min~1.7*min参数说明截断上下限数据量化算法如果选择此项则固定算法截断下限。如果不选此项通过ifmr算法学习获取下限。推荐配置不选此项必选或可选可选表 12dst_type参数说明作用量化类型。类型string取值范围INT8或INT4默认为INT8。当前版本仅支持INT8。参数说明量化时用于选择是INT8量化还是INT4量化。推荐配置-必选或可选可选【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

CANN/sip编译构建指南

编译与构建【免费下载链接】sip 本项目是CANN提供的一款高效、可靠的高性能信号处理算子加速库，基于华为Ascend AI处理器，专门为信号处理领域而设计。项目地址: https://gitcode.com/cann/sip SiP编译下载加速库源码 git clone https://gitc…...

2026/7/6 20:13:24 阅读更多 →

“9秒删库”事件刷屏！AI是凶手，但枪是你自己递的

【CSDN 编者按】“AI 把我的生产库删了！”——这话听起来足够惊悚，也足够甩锅。但真相往往没那么刺激：代码是你让 AI 写的，API 是你自己设计的，删库的端点是你亲手暴露在公网上的。本文作者一针见血地指出：…...

2026/7/8 3:11:12 阅读更多 →

基于可信AI的智能电网主动安全防御：从检测到可解释的实战框架

1. 项目概述：当电网遇上AI，安全防御如何“看得懂、说得清”？在能源行业摸爬滚打十几年，我亲眼见证了电网从物理隔离的“信息孤岛”，一步步演变为深度融合信息技术的复杂巨系统。智能电网带来了调度效率的飞跃和新能源消…...

2026/7/8 8:44:36 阅读更多 →

从论文到实践：一维卷积神经网络在RUL预测中的复现与调优

1. 为什么选择一维卷积做RUL预测？我第一次接触RUL（剩余使用寿命）预测时，发现大多数论文都在用二维卷积处理传感器数据。直到实际处理CMAPSS航空发动机数据集时，才意识到一维卷积才是更自然的选择。想象一下&#xff0c…...

2026/7/7 11:49:54 阅读更多 →

STM32与SPI EEPROM高效数据存储与检索方案

1. 项目背景与核心需求在嵌入式系统开发中，快速精确的数据检索是一个常见但极具挑战性的需求。特别是在工业控制、医疗设备和物联网终端等场景下，系统往往需要在毫秒级时间内完成关键参数的读取和写入操作。传统基于Flash存储的方案存在擦写次数有限、操…...

2026/7/7 6:45:27 阅读更多 →

23-AGENTS.md高级用法

23 AGENTS.md 高级用法概述上一篇文章介绍了 AGENTS.md 的三层加载机制，这是 AGENTS.md 体系的基础。但在实际的大型项目中，三层结构往往不够灵活。团队经常面临这样的场景：同一个 Git 仓库中包含多个服务或模块，每个模块都有自己的独特规范，同时还要继承项目级的通用…...

2026/7/8 3:11:33 阅读更多 →