智象未来开放日揭秘:多模态大模型战略从模型到平台,剑指世界模型与商业化!
多模态热潮下的智象未来判断一家Day 1就在做多模态大模型的公司无法拒绝参与到具身智能和世界模型热潮之中。2026年随着Seedance 2.0、GPT Image 2.0等模型的爆火多模态能力越来越成为行业内绕不开的关键词。5月19日智象未来首届开放日上智象未来给出判断“原生多模态是实现AGI的必经之路”。活动主题为“Imaging the World”对智象未来而言「World」的重要性几乎要放在「Video」和「Image」之前。智象未来CEO梅涛反复提及公司终极目标是打造世界模型要做一家原生多模态大模型公司。世界模型的条件与智象的选择在梅涛看来真正的世界模型需满足掌握物理规律、解决长时间跨度的因果推理、实现全模态交互以及绝对的安全性等条件。当下业界主流世界模型训练路线分李飞飞的“生成3D世界”一派和Yann LeCun的“自监督预测世界”一派智象未来则选择做算法和架构层的创新从多模态数据入手聚焦视频、图像、3D交互等数据生成用低成本合成数据对抗数据稀缺瓶颈积累视觉模型能力。其原生全模态Unified TransformerUiT架构能做到“Any to Any”符合世界模型所需能力。战略转变与平台打造过去一段时间智象未来从“模型即产品”转变为“做Agent平台”概括打法是做“113”MaaS软件即服务平台包括底层HiDream系列大模型、中间层HiHarness企业服务平台以及上层商业营销、影视创作、社媒创作三大场景应用。概念火热时资本不断押注智象未来继拿到安徽省产投、东方富海等机构参投的5亿人民币B轮融资后两周内又完成亿元级新一轮融资。对话探讨行业问题开放日结束后媒体与智象未来CEO梅涛及投资人东方富海合伙人王兵对话。梅涛认为目前称一些模型为世界模型还太早智象未来更倾向定义为原生多模态大模型公司未来会通往世界模型。谈到技术他表示多模态生成领域技术未收敛是创业公司机会可通过算法创新实现与大厂同等效果。从全模态大模型到世界模型需掌握物理规律、解决长上下文因果关系、实现全模态交互、保障安全性。对于视频模型他提出模型能力、视频时长、实时性与交互能力三个维度要求。在数据方面智象未来做工具链条收集、清洗和标注数据拥有20万小时有影视版权视频数据还与厂商合作并寻求与头部影视公司合作用真实数据及机器合成数据训练模型。商业前景与竞争策略王兵认为Sora关停下架不影响投资决策视频生成赛道有商业化进展但存在版权问题这也是投资智象未来原因。他觉得视频模型会赚钱算力成本下降且视频生成效果达商业化水准。To B毛利率高多模态模型Token毛利率高于大语言模型。衡量视频赛道企业商业化节点标准包括团队技术背景、稳定性、资金和研发效率及专注力。他建议创业公司先做To B提升产品和场景落地能力并实现收入。智象未来打造MaaS平台沉淀自研能力并接入第三方模型有不同收费模式。面对大厂竞争智象未来从实现与大厂共存和吸引客户合作两方面应对在图片和视频领域形成差异化优势沉淀Skills和行业Knowhow把控爆款规律。