CANN ops-nn EluV2算子API文档
EluV2【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn产品支持情况产品是否支持Atlas A2 训练系列产品/Atlas A2 推理系列产品√功能说明计算指数线性单元激活函数Elu的结果。函数原型每个算子分为两段式接口必须先调用“aclnnEluV2GetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器再调用“aclnnEluV2”接口执行计算。aclnnStatus aclnnEluV2GetWorkspaceSize( const aclTensor* self, const aclScalar* alpha, const aclScalar* scale, const aclScalar* inputScale, aclTensor* out, uint64_t* workspaceSize, aclOpExecutor** executor);aclnnStatus aclnnEluV2( void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, aclrtStream stream);参数说明aclnnEluV2GetWorkspaceSize参数名输入/输出描述使用说明类型数据格式维度非连续Tensorself输入输入数据张量数据类型支持fp16fp32bf16aclTensor*ND1-8√alpha输入输入参数数据类型fp32默认值为1.0aclScalar*scale输入输入参数数据类型fp32默认值为1.0aclScalar*inputScale输入输入参数数据类型fp32默认值为1.0aclScalar*out输出输出数据张量数据类型同输入selfaclTensor*同输入self同输入self√workspaceSize输出返回需要在Device侧申请的workspace大小uint64_t*executor输出返回op执行器包含了算子计算流程aclOpExecutor**aclnnEluV2参数名输入/输出描述workspace输入在Device侧申请的workspace内存地址workspaceSize输入在Device侧申请的workspace大小由第一段接口aclnnEluV2GetWorkspaceSize获取executor输入op执行器包含了算子计算流程由第一段接口 aclnnEluV2GetWorkspaceSize 获取stream输入指定执行任务的Stream流返回值返回值说明ACLNN_SUCCESS (0)成功ACLNN_ERR_PARAM_NULLPTR输入参数中存在空指针ACLNN_ERR_PARAM_INVALID输入参数不合法dtype 不匹配、shape 不一致、不支持的 dtype、不支持的 format、维度超限等ACLNN_ERR_INNER_CREATE_EXECUTOR内部创建执行器失败ACLNN_ERR_INNER_NULLPTR内部操作返回空指针约束说明无调用示例示例代码参考examples/test_aclnn_elu_v2.cpp具体编译和执行过程请参考编译与运行样例。【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考