定位:融会贯通基础篇 15 章知识,从零交付一个可在本机运行的部门级知识库问答服务。核心知识点:数据加载、文档切分、向量化、索引构建、检索过滤、QueryEngine、FastAPI 服务化、测试验证。实战目标:交付一个包含 CLI 客户端 + REST API + 测试套件 + 排障手册的完整项目,30 条测试问题命中率 80%+,每个答案都有引用来源。1. 项目背景1.1 业务场景某中型软件公司"星云科技"的研发部门共有 50 名工程师,分布在后台开发、前端开发、数据平台、质量保障、DevOps 五个小组。公司成立六年以来,团队内部沉淀了 200+ 篇技术文档,分散在多个平台中:GitLab Wiki:约 80 篇,主要是项目 README、架构设计文档、API 接口说明、部署方案、技术选型记录;Confluence:约 70 篇,包括编码规范、Code Review 指南、故障复盘报告、季度技术规划;共享文件夹:约 50 篇,涵盖运维手册、环境配置指南、中间件使用说明、新人入职 SOP。这些文档表面上是团队的"知识资产",实际上却在不断制造效率黑洞:新员工学习成本高:每个