经常有朋友问我人机环境系统智能空间与杨立昆、李飞飞的空间智能有何不同在此初步做个说明不当之处还望不吝批评指正虽然这三个概念都包含“空间智能”但它们的内涵、目标和技术路径截然不同。简单来说“人机环境系统智能空间”是一个宏观的系统哲学框架而李飞飞和杨立昆的“空间智能”则是两种具体的、相互竞争的技术实现路径。我们可以用一个比喻来理解* 人机环境系统 是“城市规划蓝图”它定义了城市智能系统需要哪些功能区空间与非空间智能以及它们如何协同工作。* 李飞飞的路径 是“建筑与视觉设计师”她专注于如何逼真地生成和构建这个城市的3D外观和结构。* 杨立昆的路径 是“物理引擎与预测大脑”他专注于理解城市运行的内在规律如交通规则、物理定律并预测未来会发生什么。下面我们来详细拆解这三者的区别。️ 人机环境系统智能空间一个宏观的系统哲学“人机环境系统智能”并非指某一项具体技术而是一个强调人、机器与环境三者动态交互的复合智能形态。它的核心在于“协同”与“融合”。* 核心内涵它认为完整的智能由两大支柱构成1. 空间智能负责感知物理或虚拟空间中的位置、结构、运动和相互关系。例如自动驾驶汽车感知路况、机器人识别工件位置。2. 非空间智能负责处理超越物理属性的抽象信息如语言理解、逻辑推理、情感计算和价值决策。例如智能客服理解用户需求、医疗系统结合病历进行诊断。* 目标通过“空间”与“非空间”智能的深度融合实现系统整体的自适应和高效能。它更像一个顶层设计的哲学框架旨在整合人类智慧擅长模糊推理和创造与机器能力擅长高精度感知和计算。 李飞飞的空间智能生成与构建3D世界李飞飞Fei-Fei Li提出的“空间智能”更侧重于感知、生成和交互。她认为如果语言模型教会了机器“读和写”那么空间智能就是要教会机器“观察和建造”。* 核心理念将三维空间“标记化”tokenize类似于处理文本让AI能够理解、生成并操控三维世界。* 技术路径通过其公司 World Labs 发布的“世界模型”如 Marble从一张照片或一段文字描述中生成一个高保真、持久存在且可自由漫游的3D环境。* 目标创造一个“看得见、摸得着”的3D世界工厂。其应用主要服务于游戏、电影、虚拟现实等内容创作领域以及为机器人提供仿真训练环境。它强调的是视觉化和创作导向。 杨立昆的空间智能预测与理解世界规律杨立昆Yann LeCun的“空间智能”则完全不同他主张的是预测式的世界模型。他认为AI的核心是理解世界的运行规律而非生成逼真的图像。* 核心理念在抽象的“潜在空间”latent space中对世界的状态变化进行预测而不是重构具体的像素或几何图形。* 技术路径他的世界模型更像一个“看不见但能精准预判的内部模拟器”。它通过学习物理常识和因果关系来预测在当前状态下采取某个行动后世界会变成什么样。* 目标打造一个服务于机器人控制和高级推理规划的“预测大脑”。其侧重点是认知科学和机器人导向旨在让AI具备对世界本质的理解能力以便进行长期规划和复杂决策。 总结对比为了更清晰地展示三者的区别可以参考下表维度 人机环境系统智能空间 李飞飞的空间智能 杨立昆的空间智能本质定位 宏观的系统哲学框架 具体的技术实现路径 具体的技术实现路径核心焦点 协同空间智能与非空间智能的融合 生成构建可感知、可交互的3D世界 预测在抽象层面理解并预判世界变化技术路径 整合多模态信息与任务协同 生成式世界模型如Marble 预测式世界模型主要目标 实现系统整体的自适应与高效能 服务于内容创作、VR、机器人仿真 服务于机器人控制、高级推理与规划