Nature 正刊：首个能与人类精英对战的乒乓球机器人

张

张建站

2026/7/11 0:39:41

10分钟阅读

人工智能系统已在许多电脑游戏中超越人类专家但像乒乓球这样的物理性、实时运动仍是巨大挑战。这类运动需要在障碍物附近、处于人类反应时间边缘完成快速、精准且对抗性的互动。尽管自1983年以来各种乒乓球机器人不断涌现但以往工作往往通过修改规则如限制场地、使用球发射器、忽略旋转来简化问题且大多回避了“旋转”这一影响球轨迹和弹跳的关键因素。近期Nature正刊介绍智能系统Ace——据我们所知这是首个能在官方竞赛规则下与精英人类乒乓球选手竞争的现实世界自主系统。Ace通过基于事件视觉传感器的高速感知、无模型深度强化学习控制以及最先进的高速机器人硬件在高水平比赛中实现了对高速、高旋转击球的稳定回攻标志着物理AI代理在复杂实时交互任务上的重要突破。Ace由三个主要部分组成感知、控制和机器人硬件。感知系统结合9台APS摄像头200 Hz三角定位误差3.0 mm延迟10.2 ms进行球的3D定位并利用三套视线控制系统GCS测量球的角速度。每套GCS包含事件视觉传感器EVS、长焦可调镜头和可旋转镜组通过卷积神经网络与对比度最大化两种异步方法估算旋转以约400-700 Hz的频率向控制系统传递角速度平均测量误差24.8 rad/s。控制部分为发球和相持阶段。相持阶段采用基于软演员-评论家SAC算法的非对称actor-critic深度强化学习架构评论员在模拟中获取真实球状态策略则接收带噪声的传感器测量历史从而确保零样本迁移到现实。策略每32 ms输出一个抽象动作该动作通过映射算法转换为未来32 ms后可行的关节位置和速度并作为优化问题的终端约束生成最小加加速度的轨迹段。同时近时间最优模型预测控制MPC生成回到目标静止位置的“重置轨迹”若检测到碰撞则执行重置轨迹以保证安全。多个策略针对不同技能如上旋、下旋、落点分别训练比赛中通过固定、随机、启发式或数据驱动的采样器选择策略。发球采用从人类演示提取的抛掷动作并在模拟中用遗传算法优化击球参数经真实机器人验证后存入发球库。机器人硬件是定制8自由度平台2个棱柱关节6个旋转关节工作空间3.6 m×3.6 m末端执行器最高速度满足20 m/s击球需求。机器人连杆采用拓扑优化与增材制造所有执行器以1 ms周期同步位置跟踪延迟低于5 ms。2025年4月研究团队依照国际乒联ITTF官方规则仅引入金分规则对Ace进行了严格评估。Ace与五位拥有超过10年密集训练的精英选手三女两男进行三局两胜制比赛五场中赢得三场总计13局中赢下七局与两位日本T.League职业选手进行五局三胜制比赛虽两场皆负但在七局中赢下一局。Ace的最大回球线速度达16.4 m/s角速度达600 rad/s在高速16 m/s和高旋转450 rad/s条件下回球成功率均超过75%显著优于此前竞技乒乓球机器人报告的水平。平均相持回合长度为5.0拍标准差3.0长于人类对战的典型值3.9±2.0拍。值得注意的是Ace并非依靠更快击球得分而是通过多样化旋转和稳定回球赢得比赛。此外Ace的低延迟感知与控制能够应对意外情况如球击中网顶在49 ms内调整轨迹并成功回球展示了系统对罕见动态事件的快速适应能力。Ace首次证明AI系统能够在未经修改的专业级设备和规则下于互动式、基于身体技能的实时运动中超越人类运动员。这一成果得益于新颖的感知系统与基于学习的控制算法类似技术有望推广到其他需要快速实时控制和人类交互的领域例如制造机器人、服务机器人以及人机协作场景。未来的改进方向包括建立更精确的人类对手模型以理解战术与战略重要性引入在线学习以实现现实世界中的持续进化以及探索更复杂的旋转组合与击球策略。正如1992年奥运会选手中村欣次郎所评论“没有其他人能做到这一点……意味着人类也有可能做到。”随着物理AI系统如Ace的出现人机互动的方式和竞技运动本身可能正迎来新的变革。

智慧交通之交通标志检测数据集交通标志识别限速牌识别超重牌识别禁停牌识别自动驾驶场景下的交通标志识别算法智能交通系统中交通规则合规性检测

中国道路交通标志检测数据集数据集核心信息表指标详情类别数量及中文名称175 类，包含事故区域、注意安全、非机动车靠右、非机动车专用道、监控、前方有儿童等数据数量9100 张图像数据集格式YOLO 格式最重要应用价值支撑自动驾驶场景下的交通标志识别算法开发&#…...

2026/7/5 16:09:41 阅读更多 →

Postman便携版终极指南：5分钟掌握免安装API开发神器

Postman便携版终极指南：5分钟掌握免安装API开发神器【免费下载链接】postman-portable 🚀 Postman portable for Windows 项目地址: https://gitcode.com/gh_mirrors/po/postman-portable Postman便携版是一款专为Windows用户设计的免安装API开发…...

2026/7/7 20:23:48 阅读更多 →

Voxtral-4B-TTS-2603多语言落地：跨境电商独立站商品页语音导购（英/法/德/西/意）

Voxtral-4B-TTS-2603多语言落地：跨境电商独立站商品页语音导购（英/法/德/西/意） 1. 语音导购的商业价值在跨境电商领域，语言障碍是影响转化率的重要因素之一。传统解决方案依赖人工录制多语言音频，成本高且更新困难…...

2026/7/8 3:03:35 阅读更多 →

从论文到实践：一维卷积神经网络在RUL预测中的复现与调优

1. 为什么选择一维卷积做RUL预测？我第一次接触RUL（剩余使用寿命）预测时，发现大多数论文都在用二维卷积处理传感器数据。直到实际处理CMAPSS航空发动机数据集时，才意识到一维卷积才是更自然的选择。想象一下&#xff0c…...

2026/7/9 17:20:07 阅读更多 →

STM32与SPI EEPROM高效数据存储与检索方案

1. 项目背景与核心需求在嵌入式系统开发中，快速精确的数据检索是一个常见但极具挑战性的需求。特别是在工业控制、医疗设备和物联网终端等场景下，系统往往需要在毫秒级时间内完成关键参数的读取和写入操作。传统基于Flash存储的方案存在擦写次数有限、操…...

2026/7/10 3:37:57 阅读更多 →

23-AGENTS.md高级用法

23 AGENTS.md 高级用法概述上一篇文章介绍了 AGENTS.md 的三层加载机制，这是 AGENTS.md 体系的基础。但在实际的大型项目中，三层结构往往不够灵活。团队经常面临这样的场景：同一个 Git 仓库中包含多个服务或模块，每个模块都有自己的独特规范，同时还要继承项目级的通用…...

2026/7/10 3:38:32 阅读更多 →