CANN/asc-devkit GetTensorC接口
GetTensorC【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况Ascend 950PR/Ascend 950DT不支持Atlas A3 训练系列产品/Atlas A3 推理系列产品支持Atlas A2 训练系列产品/Atlas A2 推理系列产品支持Atlas 200I/500 A2 推理产品不支持Atlas 推理系列产品AI Core不支持Atlas 推理系列产品Vector Core不支持Atlas 训练系列产品不支持功能说明在完成Iterate操作后调用本接口获取结果矩阵块完成数据从L0C到GM的搬运。此接口与Iterate接口配合使用用于在Iterate执行迭代计算后获取结果矩阵。函数原型template bool sync true __aicore__ inline void GetTensorC(const AscendC::GlobalTensorDstT output, uint8_t enAtomic 0, bool enSequentialWrite false)参数说明表1模板参数说明参数名描述sync预留参数用户无需感知。表2接口参数说明参数名输入/输出描述output输入将计算结果搬至Global Memory的GM地址。enAtomic输入预留参数用户无需感知。enSequentialWrite输入预留参数用户无需感知。返回值说明无约束说明GetTensorC接口必须在Iterate后进行调用完成卷积反向实现调用顺序如下。while (Iterate()) { GetTensorC(); }调用示例while (gradInput_.Iterate()) { gradInput_.GetTensorC(gradInputGm_[offsetC_]); }【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考