运维养龙虾--AI 驱动的架构图革命:draw.io MCP 让运维画图效率提升 10 倍,使用codebuddy实战
运维工程师最头疼的事之一不是故障排查而是画图。网络拓扑图、部署架构图、变更流程图……每次改一个节点就要手动拖拽半小时。现在这个问题有了根本性的解法。痛点运维画图的隐形成本你是否经历过这样的场景交接文档时架构图已经过时了三个月没人知道谁改了什么故障复盘时需要临时画一张拓扑图结果图没画完会议已经结束变更评审时架构图上的每个节点都要手动拖拽对齐耗时一小时内容十分钟写运维规范时流程图需要反复修改每改一次就要重新调整布局这些场景里画图本身往往不是目的而是障碍。工具越复杂思路越被打断。draw.io MCPModel Context ProtocolServer 的出现让 AI 助手可以直接生成、编辑和渲染架构图彻底改变了这一工作流。什么是 draw.io MCPdraw.io MCP 是由 draw.io 官方团队JGraph发布的 MCP 服务器它将 draw.io 强大的图表能力接入任何支持 MCP 协议的 AI 客户端如 Claude Desktop、Cursor 等。简单来说你用自然语言描述图AI 帮你画好直接在 draw.io 里打开编辑。整个项目包含四个组件组件说明MCP Tool Server本文重点在 draw.io 编辑器中直接打开 AI 生成的图表MCP App Server在 AI 聊天界面内联渲染图表Skill CLIClaude Code 技能生成原生.drawio文件Project Instructions零安装方案使用 Claude Project 指令核心能力三种图表生成方式draw.io MCP Server 提供三个工具覆盖运维工作中最常见的图表场景1.open_drawio_xml— 生成任意架构图直接生成原生 draw.io XML适合云架构图AWS / 阿里云 / 腾讯云拓扑网络拓扑图VPC、子网、安全组、路由服务依赖图微服务调用关系K8s 集群架构图示例 Prompt使用 open_drawio_xml 创建一张包含以下内容的 AWS 架构图 - 一个 VPC包含 2 个可用区 - 每个可用区有一个公有子网和一个私有子网 - 公有子网部署 ALB 和 NAT Gateway - 私有子网部署 ECS 集群3 个实例和 RDS 主从 - 安全组规则标注AI 自动生成完整的 XMLdraw.io 立即打开所见即所得。2.open_drawio_csv— 从数据生成关系图将结构化数据CSV 格式直接转换为图表适合组织架构图部门层级、人员汇报关系服务依赖矩阵哪些服务依赖哪些中间件告警升级链告警 → 一线 → 二线 → 值班经理CMDB 拓扑资产关系可视化示例 Prompt使用 open_drawio_csv 创建运维团队的告警升级架构图 Prometheus告警 → 一线运维 一线运维 → 二线运维15分钟未处理 二线运维 → 值班经理30分钟未处理 值班经理 → CTOP0级别3.open_drawio_mermaid— 将 Mermaid 转为可编辑图表Mermaid 是很多运维文档中常用的文字化图表格式但可编辑性差。draw.io MCP 可以将 Mermaid 语法直接转为可在 draw.io 中编辑的图表适合部署流程图CI/CD Pipeline故障处理 SOP序列图数据库 ER 图变更审批流示例 Prompt使用 open_drawio_mermaid 创建 OAuth2 认证流程的序列图 包含用户、前端应用、认证服务器、资源服务器四个参与方快速上手5 分钟接入 Claude Desktop前置要求Node.js 18Claude Desktop或任意支持 MCP 的客户端第一步安装 MCP Server无需单独安装直接通过npx使用# 验证 npx 可用 npx drawio/mcp --version如需全局安装npm install -g drawio/mcp第二步配置 Claude Desktop找到配置文件并添加 drawio MCPmacOSvi ~/Library/Application\ Support/Claude/claude_desktop_config.jsonWindows%APPDATA%\Claude\claude_desktop_config.json添加以下配置{ mcpServers: { drawio: { command: npx, args: [drawio/mcp] } } }第三步重启 Claude Desktop重启后在 Claude 对话框中应能看到 draw.io 工具已加载工具栏显示锤子图标。第四步开始使用帮我用 draw.io 画一张 Kubernetes 集群架构图 包含Master 节点 × 3Worker 节点 × 5 etcd 集群Ingress Controller以及外部 LoadBalancerClaude 会自动调用open_drawio_xml生成完整图表并在 draw.io 中打开。运维场景实战5 个高频用例场景一快速绘制故障排查拓扑图传统方式打开 draw.io → 拖拽节点 → 连线 → 调整布局 → 标注 → 30 分钟使用 draw.io MCP画一张故障排查拓扑图描述如下问题 - 用户反馈 API 响应超时 - 链路用户 → CDN → SLB → Nginx4台→ 应用服务8台→ Redis → MySQL - 已排查CDN 正常SLB 正常 - 疑似Nginx 到应用服务之间的连接池耗尽 请用红色标注疑似故障点绿色标注已排查正常节点效果2 分钟内生成带颜色标注的完整拓扑图直接用于故障复盘汇报。场景二自动生成变更影响范围图画一张变更影响范围图 本次变更升级 Redis 版本从 6.2 到 7.0 直接依赖 Redis 的服务订单服务、购物车服务、Session 服务 间接依赖支付服务通过订单服务、推荐服务通过购物车 请用橙色标注直接影响黄色标注间接影响灰色标注不受影响的服务变更评审时一张清晰的影响范围图比一页文字说明有效 10 倍。场景三生成 CI/CD 流水线图使用 open_drawio_mermaid 画一张 GitLab CI/CD 流水线图 阶段代码提交 → 静态扫描 → 单元测试 → 构建镜像 → 推送镜像仓库 → 部署到测试环境 → 自动化测试 → 人工审核 → 部署到生产环境 其中人工审核标注为必要审批节点场景四可视化监控告警链路用 open_drawio_csv 生成监控告警链路图 指标采集Node Exporter → Prometheus 日志采集Filebeat → Elasticsearch 告警规则Prometheus → AlertManager 通知渠道AlertManager → 钉钉群、短信、PagerDuty 值班系统PagerDuty → 值班工程师场景五数据库架构文档化画一张 MongoDB 副本集架构图 - Primary 节点192.168.1.11:27017 - Secondary 节点1192.168.1.12:27017 - Secondary 节点2192.168.1.13:27017 - 副本集名称rs0 - 标注Primary 处理写操作Secondary 可读oplog 单向同步 - 应用连接方式通过副本集连接串自动感知 Primary 切换结合上文中部署的 MongoDB 副本集几分钟内就能产出配套的架构文档图。实战场景codebuddy 接入drawio mcp并实现AI画图1.添加mcp server{ mcpServers: { drawio: { command: npx, args: [drawio/mcp] } } }2.在codebuddy给AI提示例如使用drawio 画一个架构图要求如下 1.在移动云购买了15台服务器ip为172.31.0.101-172.31.0.115 2.其中2台安装mysql主从数据库,ip为172.31.0.101-172.31.0.102 3.其中3台安装redis中间件minionacos共用172.31.0.103-172.31.0.105 4.其中2台运行nginx作为前段入口通过lb负载均衡进行访问 5.其中3台运行k8s master节点ip为172.31.0.106-172.31.0.108 6.剩余5台运维k8s worker节点 帮忙画一个架构图3.结果如下4.架构图如下工作原理技术实现揭秘draw.io MCP 的实现原理简洁而优雅自然语言描述 ↓ AI 生成图表内容XML / CSV / Mermaid ↓ MCP Server 接收内容 ↓ 使用 pako deflateRaw 压缩 Base64 编码 ↓ 生成带 #create 哈希参数的 draw.io URL ↓ URL 返回给 AI 客户端 → 用户点击打开 ↓ draw.io 解码内容渲染为可编辑图表整个过程无需后端服务器图表数据完全在 URL 中传递数据不上传、不存储、完全本地化对企业内网环境也完全友好。与传统方式的效率对比场景传统方式耗时draw.io MCP 耗时效率提升绘制三层网络拓扑图30-60 分钟2-3 分钟10-20x故障复盘架构图20-40 分钟2 分钟10-20xCI/CD 流程图15-30 分钟1-2 分钟10-15x变更影响范围图20-30 分钟2-3 分钟8-15x微服务依赖图20服务1-2 小时5-10 分钟10x更重要的是修改成本从重新画变成了重新描述图表版本管理也从截图变成了可 diff 的文本文件。运维团队接入建议建议一写好描述 Prompt 模板把常用图表的描述模板整理为运维 Wiki团队成员直接复用减少重复描述markdown复制## AWS 三层架构图模板 使用 open_drawio_xml 画一张 AWS 三层架构图 - VPC CIDR: [填写]可用区: [填写] - 公有子网: ALB NAT Gateway Bastion - 私有子网: [填写应用服务] - 数据子网: [填写数据库] - 安全组规则: [填写]建议二与运维文档体系集成draw.io 支持导出为 SVG/PNG/PDF生成后直接嵌入 Confluence、语雀、飞书文档做到图文档同源。建议三用于变更单自动化在变更申请流程中要求提交影响范围图借助 draw.io MCP 可以将画图环节的阻力降到最低提高变更单质量。建议四配合其他运维 MCP 联动draw.io MCP 可以与其他运维类 MCP 工具配合使用先用CMDB MCP查询资产信息再用draw.io MCP将资产关系可视化最后用文档 MCP将图表嵌入运维手册注意事项确保 AI 使用 draw.io MCP 工具由于 AI 有时会直接用文字或代码块描述图表建议在系统提示词或对话开头明确说明请始终使用 draw.io MCP 工具创建图表不要用代码块输出图表内容。总结draw.io MCP 把描述图和画图之间的鸿沟彻底填平。对于运维工程师来说它带来的价值不仅仅是省时间更是降低文档门槛谁都能快速产出专业级架构图提高文档质量图表不再因为太麻烦而缺失或过时加速沟通效率一张清晰的图胜过千行文字赋能非专业用户开发、产品、项目经理也能自助生成拓扑图在 AI MCP 的时代运维工程师的核心价值在于架构判断和经验积累而不是手动拖拽图形。把重复性工作交给 AI把脑力留给真正重要的事。参考资源项目仓库https://github.com/jgraph/drawio-mcpdraw.io 在线编辑器https://app.diagrams.netdraw.io 桌面版下载https://github.com/jgraph/drawio-desktopMCP 协议规范https://modelcontextprotocol.ionpm 包drawio/mcp