Nature 正刊:首个能与人类精英对战的乒乓球机器人
人工智能系统已在许多电脑游戏中超越人类专家但像乒乓球这样的物理性、实时运动仍是巨大挑战。这类运动需要在障碍物附近、处于人类反应时间边缘完成快速、精准且对抗性的互动。尽管自1983年以来各种乒乓球机器人不断涌现但以往工作往往通过修改规则如限制场地、使用球发射器、忽略旋转来简化问题且大多回避了“旋转”这一影响球轨迹和弹跳的关键因素。近期Nature正刊介绍智能系统Ace——据我们所知这是首个能在官方竞赛规则下与精英人类乒乓球选手竞争的现实世界自主系统。Ace通过基于事件视觉传感器的高速感知、无模型深度强化学习控制以及最先进的高速机器人硬件在高水平比赛中实现了对高速、高旋转击球的稳定回攻标志着物理AI代理在复杂实时交互任务上的重要突破。Ace由三个主要部分组成感知、控制和机器人硬件。感知系统结合9台APS摄像头200 Hz三角定位误差3.0 mm延迟10.2 ms进行球的3D定位并利用三套视线控制系统GCS测量球的角速度。每套GCS包含事件视觉传感器EVS、长焦可调镜头和可旋转镜组通过卷积神经网络与对比度最大化两种异步方法估算旋转以约400-700 Hz的频率向控制系统传递角速度平均测量误差24.8 rad/s。控制部分为发球和相持阶段。相持阶段采用基于软演员-评论家SAC算法的非对称actor-critic深度强化学习架构评论员在模拟中获取真实球状态策略则接收带噪声的传感器测量历史从而确保零样本迁移到现实。策略每32 ms输出一个抽象动作该动作通过映射算法转换为未来32 ms后可行的关节位置和速度并作为优化问题的终端约束生成最小加加速度的轨迹段。同时近时间最优模型预测控制MPC生成回到目标静止位置的“重置轨迹”若检测到碰撞则执行重置轨迹以保证安全。多个策略针对不同技能如上旋、下旋、落点分别训练比赛中通过固定、随机、启发式或数据驱动的采样器选择策略。发球采用从人类演示提取的抛掷动作并在模拟中用遗传算法优化击球参数经真实机器人验证后存入发球库。机器人硬件是定制8自由度平台2个棱柱关节6个旋转关节工作空间3.6 m×3.6 m末端执行器最高速度满足20 m/s击球需求。机器人连杆采用拓扑优化与增材制造所有执行器以1 ms周期同步位置跟踪延迟低于5 ms。2025年4月研究团队依照国际乒联ITTF官方规则仅引入金分规则对Ace进行了严格评估。Ace与五位拥有超过10年密集训练的精英选手三女两男进行三局两胜制比赛五场中赢得三场总计13局中赢下七局与两位日本T.League职业选手进行五局三胜制比赛虽两场皆负但在七局中赢下一局。Ace的最大回球线速度达16.4 m/s角速度达600 rad/s在高速16 m/s和高旋转450 rad/s条件下回球成功率均超过75%显著优于此前竞技乒乓球机器人报告的水平。平均相持回合长度为5.0拍标准差3.0长于人类对战的典型值3.9±2.0拍。值得注意的是Ace并非依靠更快击球得分而是通过多样化旋转和稳定回球赢得比赛。此外Ace的低延迟感知与控制能够应对意外情况如球击中网顶在49 ms内调整轨迹并成功回球展示了系统对罕见动态事件的快速适应能力。Ace首次证明AI系统能够在未经修改的专业级设备和规则下于互动式、基于身体技能的实时运动中超越人类运动员。这一成果得益于新颖的感知系统与基于学习的控制算法类似技术有望推广到其他需要快速实时控制和人类交互的领域例如制造机器人、服务机器人以及人机协作场景。未来的改进方向包括建立更精确的人类对手模型以理解战术与战略重要性引入在线学习以实现现实世界中的持续进化以及探索更复杂的旋转组合与击球策略。正如1992年奥运会选手中村欣次郎所评论“没有其他人能做到这一点……意味着人类也有可能做到。”随着物理AI系统如Ace的出现人机互动的方式和竞技运动本身可能正迎来新的变革。