昇腾TF适配器ReduceScatter算子

张

张建站

2026/7/17 7:40:57

10分钟阅读

reduce_scatter【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow功能说明集合通信算子ReduceScatter的操作接口将通信域内所有rank的输入数据均分成rank size份然后分别取每个rank的rank size之一份数据进行归约操作如sum、prod、max、min。最后将结果按照编号分散到各个rank的输出buffer。函数原型def reduce_scatter(tensor, reduction, rank_size, grouphccl_world_group, fusion0, fusion_id-1)参数说明参数名输入/输出描述tensor输入TensorFlow的tensor类型。针对Ascend 950PR/Ascend 950DT支持数据类型int8、int16、int32、int64、uint64、float16、float32、float64、bfp16。针对int64、uint64、float64当前仅支持节点内通信。针对Atlas A3 训练系列产品/Atlas A3 推理系列产品支持数据类型int8、int16、int32、int64、float16、float32、bfp16。针对Atlas A2 训练系列产品/Atlas A2 推理系列产品支持数据类型int8、int16、int32、int64、float16、float32、bfp16。需要注意针对int64数据类型性能会有一定的劣化。针对Atlas 训练系列产品支持数据类型int8、int32、int64、float16、float32。针对Atlas 300I Duo 推理卡支持数据类型int8、int16、int32、float16、float32。需要注意tensor的第一个维度的元素个数必须是rank size的整数倍。reduction输入归约操作类型String类型。针对Ascend 950PR/Ascend 950DT支持的操作类型为sum、max、min。针对Atlas A3 训练系列产品/Atlas A3 推理系列产品支持的操作类型为sum、max、min、prod当前版本“prod”操作不支持int16、bfp16数据类型。针对Atlas A2 训练系列产品/Atlas A2 推理系列产品支持的操作类型为sum、max、min、prod当前版本“prod”操作不支持int16、bfp16数据类型。针对Atlas 300I Duo 推理卡支持的操作类型为sum、max、min、prod当前版本“max”、“min”、“prod”操作不支持int16数据类型。rank_size输入group内device的数量int类型。最大值32768。group输入String类型最大长度为128字节含结束符。group名称可以为用户自定义group或者hccl_world_group。fusion输入reducescatter算子融合标识int类型支持以下取值- 0网络编译时不会对该算子进行融合即该reducescatter算子不和其他reducescatter算子融合。- 2网络编译时会对reducescatter算子按照相同的fusion_id进行融合即“fusion_id”相同的reducescatter算子之间会进行融合。fusion_id输入reducescatter算子的融合idint类型。当“fusion”取值为“2”时网络编译时会对相同fusion_id的reducescatter算子进行融合。返回值对输入tensor执行完reducescatter操作之后的结果tensor。约束说明调用该接口的rank必须在当前接口入参group定义的范围内不在此范围内的rank调用该接口会失败。该接口要求输入tensor的数据量不超过8GB。reducescatter算子融合场景只支持reduction操作类型sum。调用示例from npu_bridge.hccl import hccl_ops tensor tf.random_uniform((2, 3), minval1, maxval10, dtypetf.float32) rank_size 2 result hccl_ops.reduce_scatter(tensor, sum, rank_size)【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

海洋AI感知基石：构建可信训练数据集的3V原则与不确定性量化实践

1. 项目概述：为什么海洋自主导航的训练数据如此特殊？在自动驾驶汽车领域，我们常听到“数据是燃料”的说法。但当场景从结构化的城市道路切换到浩瀚无垠、充满不确定性的海洋时，这句话的分量就完全不同了。我参与过多个海洋自主导航…...

2026/7/13 15:35:39 阅读更多 →

2026年毕业论文提交前两周AIGC超标紧急攻略：答辩前48小时4.8元快速达标完整方案

2026年毕业论文提交前两周AIGC超标紧急攻略：答辩前48小时4.8元快速达标完整方案分享毕业论文提交前降AI攻略这件事，是因为我走了很多弯路，早知道能少费很多力气。核心：选对工具，全文处理。主力工具是嘎嘎降AI&…...

2026/7/13 17:00:49 阅读更多 →

Blueclaw：轻量级智能爬虫工具的设计原理与实战应用

1. 项目概述与核心价值最近在GitHub上看到一个挺有意思的项目，叫“blueclaw”，作者是brandon-dacrib。乍一看这个名字，你可能会联想到“蓝爪”，感觉像是个工具或者爬虫类的项目。没错，这确实是一个网络数据采集工具&am…...

2026/7/13 15:32:32 阅读更多 →

PlantUML 实战：5分钟将 UML 2.5 序列图转换为可执行代码草图

PlantUML 实战：5分钟将 UML 2.5 序列图转换为可执行代码草图在软件开发过程中，清晰的系统设计往往比编码本身更为关键。传统拖拽式UML工具虽然直观，却常常成为效率杀手——频繁的鼠标操作打断设计思路，版本控制困难，…...

2026/7/16 12:43:00 阅读更多 →

GPT-5.6上线新模型融合编码能力

GPT-5.6系列模型已正式上线，其核心更新包括模型性能提升、分层定价以及产品界面的重大整合。原独立的Codex编码工具已并入ChatGPT，形成了统一的桌面客户端入口。 GPT-5.6系列模型概览该系列采用天体命名，包含三个定位不同的模型&#xff0…...

2026/7/16 13:02:25 阅读更多 →

终极免费PPT计时器：让你的演示时间掌控如呼吸般自然

终极免费PPT计时器：让你的演示时间掌控如呼吸般自然【免费下载链接】ppttimer 一个简易的 PPT 计时器项目地址: https://gitcode.com/gh_mirrors/pp/ppttimer 还在为PPT演示时间把控不准而焦虑吗？每次演讲都担心超时被打断，或者时间…...

2026/7/16 17:42:20 阅读更多 →

15款专业字体一次搞定：设计师和开发者的终极字体解决方案

15款专业字体一次搞定：设计师和开发者的终极字体解决方案【免费下载链接】fonts My favorite fonts: SF Pro Text, Pingfang SC, Avenir Next, Roboto, Uber and more. 项目地址: https://gitcode.com/gh_mirrors/font/fonts 还在为找不到合适的字体而烦恼吗…...

2026/7/17 0:56:57 阅读更多 →