业务流全景简介整个多Agent虚拟开发系统的业务流本质上是一条“需求 → 计划 → 任务 → 代码 → 验证 → 交付”的自动化流水线人类仅在关键决策点介入。流程分为以下阶段需求竞标人类输入一句话目标后多个异构大模型并行生成需求方案裁判模型打分人类精选出最终需求基准。多层计划树构建一级PM产出里程碑L1二级PM拆解用户故事L2架构师同步注入技术约束项目经理再将故事拆分为最长4小时的原子任务L3。智能任务路由任务路由器根据难度、类型和成本预算为每个原子任务动态选择最适合的执行模型从低成本小模型到旗舰大模型。协同执行开发、测试、运维Agent按依赖关系认领任务通过标准化Skill和MCP工具接口完成代码生成、测试、部署等工作事件总线驱动上下游自动衔接。闭环验收所有任务完成后项目经理上报里程碑人类进行最终验收完成交付。整个流转由计划树状态机驱动事件溯源保证可追溯人类只在需求定稿、里程碑审批和最终验收三个节点介入其余环节全自动运行。我们聚焦业务流在这个多Agent系统内部是如何一步步完成的通过一个具体例子——“用户用邮箱密码登录获取JWT令牌”功能——来拆解每一步的技术、触发条件和流转机制。业务流示例实现 JWT 用户登录业务目标L0用户能用邮箱和密码登录系统返回JWT令牌后续请求凭令牌访问。下面我们跟踪这个需求从提出到上线验收的完整内部流转过程。1. 需求分析与计划树生成竞标机制 计划树状态机触发条件人类在Web控制台输入L0目标并设置预算上限。流转过程竞标启动协调层的 Orchestrator 向5个不同公司的AI模型如GPT-5.5、Claude Opus 4.7、DeepSeek V4等同时派发完全相同的原始需求。每个模型在隔离的上下文内独立生成一份结构化需求清单产出被匿名化为方案A~E。多维度裁判打分一个独立的“裁判模型”对这些匿名方案进行评分维度包括完整性是否覆盖了正常登录、密码错误、账户不存在等场景、验收标准可测试性、技术可行性等。同时开启模型互评占30%权重综合得出排名。人类介入精选排名靠前的1~2份方案展示给人类项目经理人类可选择直接采用、微调或融合多方案优点形成《最终需求基准》。这一步是整个流程的第一道质量卡口只耗费人类几分钟时间。涉及技术/条件竞标协议多个模型并行生成匿名化与多维度打分表确保信息不损失。计划树初始化L0节点创建状态为planning根节点附带需求基准文档引用。成本控制此阶段使用全量竞标但限制了竞标模型数量5个和单次生成长度避免预算爆炸。2. L1里程碑拆分与L2用户故事细化触发条件需求基准被人类确认Orchestrator 发出RequirementConfirmed事件。流转过程一级产品经理AgentPM-1启动使用需求分析Skill和L1拆分Skill基于需求基准产出L1节点“认证模块”、“用户管理”如果需要注册等。对于我们的登录功能L1节点就是auth-module。竞标再次介入L1层同样用5个模型对L1计划树进行竞标评分维度侧重模块边界合理性、依赖关系清晰度、需求覆盖度。人类批准后L1节点变为approved状态。二级产品经理AgentPM-2对auth-module进行L2拆分产出用户故事“作为用户我希望使用邮箱和密码登录获取JWT令牌”并附带验收标准提供正确凭据返回200及token凭据错误返回4015次失败锁定账户等。架构师Agent同步介入产出技术约束API路径POST /api/loginJWT用RS256密钥由环境变量注入用户表设计为users(id, email, password_hash, ...)。涉及技术/条件计划树节点结构每个节点以JSON存储包含parent_id、type、status、acceptance_criteria、dependencies、estimated_hours等。跨层级约束传递架构师产出的技术方案以constraint形式挂载到L2节点后续所有执行Agent都必须遵守。状态流转L1→approvedL2→specified等待项目经理拆分为L3任务。3. 任务拆分、路由与认领触发条件L2故事状态变为specified项目经理Agent收到StorySpecified事件。流转过程项目经理AgentPM使用计划树解析Skill和任务分发Skill将L2故事拆成4个原子任务L3每任务预估时长≤4小时严格符合SMART原则T1设计用户表编写数据库迁移脚本类型开发预估1.5hT2实现POST /api/login接口包含密码验证和JWT生成类型开发预估3hT3编写登录接口的功能测试与边界测试类型测试预估2hT4配置CI流水线中的环境变量部署到测试环境并验证类型部署预估1h依赖关系设定T2依赖T1表结构必须存在T3依赖T2接口就绪才能测T4依赖T3测试通过才部署。任务路由器介入每个任务都有一个difficulty_score难度分和task_type。路由器查询模型能力库T1简单DB迁移→ 低成本模型Llama-3-70B成本效率高T2核心登录逻辑涉及加密算法→ 能力强的GPT-4-Turbo代码生成分高T3测试用例→ 中等模型Claude-3-HaikuT4运维脚本→ 低成本模型GPT-3.5-Turbo任务发布到任务板L3节点状态设为todo纳入开发Agent可见的待办池。涉及技术/条件任务路由决策算法加权计算能力匹配度、成本系数、当前并发负载选综合得分最高且在预算内的模型。计划树状态机todo → in_progress → review → done → closed初始为todo。依赖检查任务领取前协调层会检查其依赖节点是否全部done否则任务不可领取。4. 开发Agent执行任务Skill MCP工具调用触发条件Agent发现任务板有符合自己角色开发且依赖满足的todo任务自动认领。这里开发Agent-1领取T1依赖为空可立即开始开发Agent-2随后领取T2需等T1完成。流转过程——以T2为例上下文组装开发Agent自动拉取L2故事、验收标准、架构师约束以及T1产物数据库schema快照形成完整上下文。调用SkillAgent执行代码生成SkillSkill内部规划步骤读取架构约束API路径、JWT算法查询数据库schema通过Database MCP的schema_query工具生成控制器、服务层、模型代码调用单元测试生成Skill生成配套单元测试MCP工具操作Skill调用Git MCP创建特性分支将生成的代码文件写入工作区调用lint工具检查语法完成后执行git commit并推送。事件发布开发Agent通过消息总线发出CodeCompleted事件携带PR链接和任务ID。同时将T2状态更新为review等待代码审查若开启人类审查则等待人类approve否则自动推进。涉及技术/条件Skill封装代码生成Skill是一组预置prompt和工具调用链的组合所有开发Agent共用保证风格一致。MCP原子操作Git MCP提供create_branch, commit, push, create_pr等接口Agent只需调用标准名称无需处理底层凭证。事件溯源每一次状态变更领取任务、提交代码都以不可变事件写入事件存储用于后续追溯。5. 测试Agent自动验证事件驱动 闭环反馈触发条件CodeCompleted事件触发测试Agent已监听该事件类型。流转过程测试Agent认领T3类型测试依赖T2已完成。检查T2状态已变为review/done设定为通过代码审查后视为完成开始工作。使用测试用例生成Skill基于用户故事的验收标准生成功能测试脚本正常登录200、错误密码401、用户不存在401、连续失败锁定等。调用CI MCP在测试环境拉起依赖服务如数据库执行测试脚本。MCP返回测试结果报告。成功路径所有用例通过测试Agent发出TestPassed事件T3状态置为done。失败路径缺陷流转若有用例失败测试Agent自动创建缺陷记录附加日志和复现步骤通过缺陷报告Skill发回给开发Agent并将T2状态回退为rework。开发Agent收到缺陷事件后重新修正代码、提交再次触发测试。此循环可持续直到通过或超时上报项目经理。涉及技术/条件自动化缺陷路由失败时根据任务依赖图定位应负责的开发Agent消息总线直接投递缺陷事件。回环状态rework状态是计划树中的特殊分支允许任务回退而不破坏已完成记录的不可变性通过追加事件修正。6. 运维Agent部署与验证触发条件TestPassed事件触发运维Agent监听该事件。流转过程运维Agent认领T4使用环境配置Skill调用CI MCP更新部署流水线配置注入JWT密钥等环境变量。触发测试环境部署并执行健康检查调用/health端点。确认服务正常后生成部署报告发出DeploySuccess事件T4置为done。此时整个L2故事的所有L3任务都已完成项目经理Agent自动将L2节点标记为done并通知人类进行功能验收。涉及技术/条件流水线即代码CI MCP封装了对Jenkins/GitHub Actions的操作Agent不写shell只传递参数。依赖链完成自动推进所有子任务done后父节点自动演进到done无需人工点击。7. 人类验收与闭环触发条件L2或L1所有任务done项目经理上报MilestoneReadyForReview事件。流转过程人类在Web控制台查看该里程碑的产物代码PR链接、测试报告、部署环境地址。人类进行验收测试手动点击登录接口或运行额外的手工用例。验收通过后人类将L1里程碑标记为closed业务流结束。若验收不通过可手动将任一节点置为rework系统重新分配修复任务。涉及技术/条件人机交接点只有L1里程碑审批、竞标方案选择和最终验收需要人类决策其他环节全自动流转。业务流顺利运转的几个核心条件计划树的层级状态机每个任务的状态变迁都是标准化的Agent只知道“满足什么状态才能行动”整个流程受状态驱动而非主观意志驱动。事件总线与消息路由CodeCompleted→TestPassed→DeploySuccess这样的事件链条保证了松耦合的协作Agent之间从不直接调用只通过发布/订阅事件衔接。依赖检查机制任务认领前强制校验前置节点状态杜绝乱序执行。MCP标准化工具接口Git、数据库、CI系统都被封装成统一协议任何Agent只要能调用MCP工具就能操作这些外部系统消除了手工干预。模型路由与竞标在需求、计划层面利用多模型多样性提高质量在执行层面按任务难度动态分配模型兼顾成本与性能。人类仅在关键决策点介入方案选择、里程碑审批、最终验收——这三处是人类发挥作用的地方其余全部由Agent按照业务流自动完成。通过上述流程一个“JWT登录”功能从一句话需求到上线验收完全在计划树的驱动下由多个专业Agent通过竞标、拆分、开发、测试、部署的标准化协作自动完成。这就是多Agent虚拟开发内部业务流的核心运作方式。