Shadow最近我的AgentOS扩展更多的场景从情报研究最新、学术研究、微信群用户洞察等到生产洞察。系统越来越复杂面临多智能体如何稳定迭代升级的问题选型是最头疼的选得不好浪费时间还要返工。今天这篇文章可以帮助我们在选型的时候考虑地更全面少踩坑。以下为正文⬇️-----你有没有过这种感觉建了一个豪华团队每个成员都很聪明但凑在一起反而效率变低了多智能体系统也面临同样的困境。不是每个Agent不够聪明而是当智能体数量变多时协调的开销吃掉所有收益。10个智能体需要45条连接线来两两通话20个就变成了190条。真正的问题不是选哪个模式最先进而是我的瓶颈到底在哪里。就像人类团队一样小团队靠一个领导直接指挥就够了大一点就需要明确的分工再大就需要流程和规范。最重要的是到达瓶颈的时候自然就知道如何迭代而不是一开始就用最复杂的架构。你在构建多智能体系统时是否也遇到过这样的困惑选Orchestrator-Subagent还是Agent TeamsShared State听起来很美但什么时候该用它Anthropic官方最新发布的多智能体协调指南给出了答案不要一开始就选最优解而是从最简单的开始碰到瓶颈再升级。加更多Agent的核心挑战在讨论5种协调模式之前先理解为什么很多团队的多智能体架构会失败。工程师pvergadia提出了一个被广泛认可的观察多智能体协调存在O(n²)问题。当n个智能体点对点通信时所需集成连接数为Cn(n-1)/2。这意味着10个智能体需要45个连接点20个智能体需要190个。Just add another agent的思路在生产环境中会发生可怕的连接数爆炸。这才是多智能体架构的核心挑战。不是单个智能体不够聪明而是协调开销会随着规模非线性增长。多智能体协调的O(n²)问题5种协调模式解析模式一Generator-VerifierGenerator-Verifier模式工作原理Generator生成初始输出Verifier评估是否满足标准。如果不满足反馈给Generator进行修订循环直到Verifier接受或达到最大迭代次数。什么时候用它输出质量至关重要且评估标准可以明确定义的场景。例如代码生成一个智能体写代码另一个写和运行测试、事实核查、合规验证。模式二Orchestrator-SubagentOrchestrator-Subagent模式工作原理一个主智能体充当团队负责人计划工作、委托任务和汇总结果。子智能体处理特定任务并报告回来。Claude Code使用的正是这个模式主智能体自己编写代码、编辑文件和运行命令当需要搜索大型代码库或调查独立问题时在后台分派子智能体。什么时候用它任务分解清晰且子任务相互依赖最小的场景。Orchestrator保持对整体目标的全局视角而子智能体专注于特定任务。局限Orchestrator成为信息瓶颈。当子智能体发现与另一个子智能体工作相关的内容时该信息必须通过Orchestrator传播。经过多次这样的传递关键细节通常会丢失。模式三Agent Teams工作原理协调器将多个工作智能体作为独立进程生成。队友从共享队列中认领任务在多个步骤中自主工作并发出完成信号。与Orchestrator-Subagent的关键区别在于队友持久性队友在多次任务中保持活动积累上下文。什么时候用它子任务独立且受益于持续的多步骤工作。代码库迁移场景是典型案例队友可以独立迁移每个服务有自己的依赖项、测试套件和部署配置。局限队友自主操作不能轻易共享中间发现。如果一个队友的工作影响另一个两者都不知道输出可能冲突。模式四Message BusMessage Bus消息总线模式工作原理引入共享通信层智能体可以在其中发布和订阅事件。智能体订阅它们关心的话题路由器传递匹配的消息。新智能体可以开始接收相关工作而无需重新连接现有连接。什么时候用它事件驱动管道工作流程从事件中出现而不是预定序列且智能体生态系统可能增长。安全运营自动化是典型场景警报从多个来源到达分诊智能体按严重程度分类路由每个调查智能体发布充实请求而上下文收集智能体满足这些请求。局限事件驱动通信的灵活性使追踪更加困难。调试比following Orchestrator的顺序决策更难。路由准确性至关重要如果路由器错误分类或丢弃事件系统会静默失败。模式五Shared StateShared State共享状态模式工作原理让智能体直接协调通过持久存储来消除中间人所有智能体都可以读写。没有中央协调器。智能体检查存储中相关信息作用于发现的内容并将发现写回。什么时候用它智能体的工作是协作性的发现应该实时流动。情报研究系统是典型案例一个智能体探索学术文献另一个分析行业报告第三个检查专利。每个智能体的发现直接进入存储其他智能体可以立即看到并在此基础上继续工作。Anthropic内部数据显示采用Claude Opus 4作为主智能体、Sonnet 4作为子智能体的多智能体系统比单体Opus 4表现提升90.2%。局限没有明确协调智能体可能重复工作或追求矛盾的方法。更危险的是反应循环智能体A写发现智能体B读取并写后续A看到后续并响应系统继续在不会收敛的工作上燃烧token。模式选择决策树Orchestrator-Subagentvs Agent Teams两者都涉及协调器分派工作。问题是工作智能体需要多长时间维护其上下文。当子智能体需要跨调用保留状态时Agent Teams是更好的选择。Orchestrator-Subagentvs Message Bus两者都可以处理多步骤工作流程。问题是工作流程结构有多可预测。当步骤顺序提前已知时选Orchestrator-Subagent当工作流程从事件中出现时选Message Bus。Agent Teamsvs Shared State两者都涉及智能体自主工作。问题是智能体是否需要彼此的发现。当智能体在不会相互影响的独立分区上工作时选Agent Teams当智能体的工作是协作性的且发现应该实时流动时选Shared State。Message Busvs Shared State两者都支持复杂的多智能体协调。问题是工作作为离散事件流动还是累积成共享知识库。Message Bus仍然有路由器中心组件Shared State是去中心化的。如果消除单点故障是优先项Shared State更完全地提供这一点。建议Anthropic建议从Orchestrator-Subagent开始。它以最少的协调开销处理最普遍的问题。观察它在哪里出现瓶颈然后根据特定需求迭代到其他模式。在实际应用中经常组合不同模式。常见的混合使用Orchestrator-Subagent处理整体工作流程使用Shared State处理协作密集的子任务。另一个使用Message Bus进行事件路由使用Agent Teams风格的工作智能体处理每种事件类型。这不是一道有标准答案的考题而是一个需要根据真实情况逐步迭代的过程。领取Agentic Coding能力PDF社群入口如果你正在构建多智能体系统或对Agent架构的演进路径有疑问欢迎来MixLab无界社区交流。我们是最先触达未来的那一小部份人一起把想法跑成实践。你做出demo了然后呢N28期Mixlab AI编程训练营上海参考[1] Anthropic Claude Blog - Multi-agent coordination patterns — Anthropic[2] ByteByteGo - How Anthropic Built a Multi-Agent Research System — ByteByteGo[3] Twitter pvergadia - multi-agent O(n²) problem — Twitter[4] Reddit r/AI_Agents - Six months running multi-agent in production — Reddit