【AiAgent学习】RAG-检索增强生成

张

张建站

2026/5/28 15:37:34

10分钟阅读

1.什么是RAGRAG其实是三个独立的单词也是执行的基本步骤R检索--retrieveA增强--AugmentG生成--Generate简单描述就是让AI先查询资料再去回答问题就是有依据的回答而不是随便回答就例如你问一个你们公司业务方面的问题那AI是不知道的这时候就需要去文档查询找到相关的内容然后检索回答。2.实现一个简单RAG# 手写一个最简单的 RAG 系统 - 不依赖任何框架 from openai import OpenAI import os from dotenv import load_dotenv load_dotenv() client OpenAI( api_keyos.getenv(DEEPSEEK_API_KEY), base_urlhttps://api.deepseek.com ) # 1. 文档库模拟公司知识库 documents [ {id: 1, content: 公司报销流程填写报销单 → 部门经理审批 → 财务审核 → 打款, keywords: [报销, 流程, 审批]}, {id: 2, content: 请假规则事假需提前3天申请病假可当天申请年假需提前1周, keywords: [请假, 事假, 病假, 年假]}, {id: 3, content: 加班政策工作日加班1.5倍工资周末加班2倍工资节假日3倍, keywords: [加班, 工资, 节假日]}, {id: 4, content: 电脑申请流程填写IT申请表 → IT部门审批 → 领取设备约3个工作日, keywords: [电脑, IT, 申请]}, ] # 2. 检索函数关键词匹配 def retrieve(query: str, top_k2): 根据用户问题检索相关文档用关键词匹配模拟实际场景会用向量数据库 query_lower query.lower() scores [] for doc in documents: score 0 # 计算匹配度问题中的词在文档关键词中出现的次数 for word in query_lower.split(): for kw in doc[keywords]: if kw in word or word in kw: score 1 scores.append(score) # 按分数排序取 top_k 个 indexed list(enumerate(scores)) indexed.sort(keylambda x: x[1], reverseTrue) results [] for i in range(min(top_k, len(indexed))): idx indexed[i][0] if indexed[i][1] 0: results.append(documents[idx]) return results # 3. 生成回答基于检索结果 def generate_answer(query: str, contexts: list): 基于检索到的文档生成回答 if not contexts: return 抱歉没有找到相关信息。 # 构建上下文 context_text \n\n.join([f【参考文档{i1}】{doc[content]} for i, doc in enumerate(contexts)]) prompt f 你是一个企业助手。请根据以下参考文档回答用户问题。【参考文档】 {context_text} 【用户问题】 {query} 【要求】 - 只根据参考文档回答 - 如果文档中没有相关信息请说文档中没有提到 - 回答要简洁准确【回答】 response client.chat.completions.create( modeldeepseek-chat, messages[{role: user, content: prompt}], temperature0 ) return response.choices[0].message.content # 4. RAG 主流程 def rag_ask(query: str): RAG 问答入口 print(f\n{*50}) print(f用户问题: {query}) print(f{*50}) # 步骤1检索相关文档 print( 正在检索相关文档...) contexts retrieve(query) print(f 找到 {len(contexts)} 个相关文档) for doc in contexts: print(f - {doc[content][:50]}...) # 步骤2基于检索结果生成回答 print( 正在生成回答...) answer generate_answer(query, contexts) return answer # 5. 测试 if __name__ __main__: print(\n *50) print(RAG 系统演示) print(*50) # 测试1报销问题 result rag_ask(怎么报销费用) print(f\n✅ 回答: {result}) # 测试2请假问题 result rag_ask(请事假要提前多久) print(f\n✅ 回答: {result}) # 测试3不在文档中的问题 result rag_ask(公司食堂几点开门) print(f\n✅ 回答: {result})3.解析代码我们直接从主程式看也就是rag_ask函数第一个问题是怎么报销费用回忆上面说的RAG步骤第一步需要去检索调用retrieve函数传入问题和拿到文档的个数限制程序遍历了documents文档然后用问题在keywords里面寻找相关的文档每次按照匹配上的次数多少给score 1然后进行编号元组、转成列表排序、取值indexed是[(2, 2), (0, 1), (3, 1), (1, 0)]min(top_k, len(indexed))取top_k和len(indexed)中较小的作为匹配的数量进行循环取到下标拿到documents中对应的文件作为结果第二步把拿到的文件给AI让AI在里面找答案做出回答answer generate_answer(query, contexts)这里面简单一些就是把doc的信息作为context_text上下文传入提示词中一定要注明仅在参考文档中找答案第三步返回answer打印结果4.向量化上面是没有用向量数据库的RAG就是在理解原理检索的时候后面会引入向量数据库就是把documents转成成向量并存入数据库然后在向量数据库里面检索。先记住一些词Embedding模型、向量相似度、chroma、sentence-transformers。下一章继续。

3600 行代码搞定 Java 泛型反射！EggG 解决多场景泛型解析难题

一枚「蛋」的诞生如果你写过框架级代码，肯定经历过这样的绝望：为搞清楚 List> 里的类型，在 Type、ParameterizedType、TypeVariable 的迷宫中绕了两小时，最后写出一堆第二天自己都看不懂的反射代码。[EggG](https://github.com…...

2026/5/28 15:37:34 阅读更多 →

紧急预警：Claude v3.5升级后API Schema静默变更已致37家客户测试用例批量失效！立即启用这4个动态Schema校验机制

更多请点击： https://intelliparadigm.com 第一章：Claude集成测试方案为保障Claude模型在实际业务系统中的稳定性、响应一致性与安全合规性，需构建端到端的集成测试方案。该方案聚焦于API网关层、提示工程注入点、上下文管理模块及结果后处…...

2026/5/28 15:34:36 阅读更多 →

Taotoken平台新用户入门指南从注册到首次API调用

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度 Taotoken平台新用户入门指南从注册到首次API调用欢迎来到Taotoken。作为大模型售卖与聚合分发平台，我们提供OpenAI兼容…...

2026/5/28 15:34:35 阅读更多 →

Oracle EBS R12 主 / 辅助分类帐（主 / 辅助帐套）

Oracle EBS R12 主 / 辅助分类帐（主 / 辅助帐套）落地全套文档包含：配置清单、科目映射规则模板、4 类典型调整分录、税会 / IFRS 案例分录，可直接用于实施、方案文档、上线配置。说明：R11 帐套 (SOB)、R12 分类帐 (Led…...

2026/5/27 16:21:02 阅读更多 →

Harness的配置漂移检测与自动修复

云原生时代的稳定性利器：Harness配置漂移检测与自动修复全指南引言痛点引入相信每一位DevOps工程师、SRE或者运维负责人都遇到过这样的噩梦： 测试环境验证了3天的功能，上线到生产10分钟就出现503错误，排查了2小时才发现&…...

2026/5/28 12:21:09 阅读更多 →

【工程实践】代码质量与测试策略：构建可靠的软件交付体系

【工程实践】代码质量与测试策略：构建可靠的软件交付体系引言代码质量是软件项目成功的关键因素之一。良好的代码质量不仅能提高开发效率，还能降低维护成本，提升系统的可靠性。本文将详细介绍代码质量保障和测试策略的最佳实践。一、代码质…...

2026/5/28 13:47:19 阅读更多 →

3分钟快速上手OBS多平台同步直播插件：告别重复配置，一键推流到多个平台

3分钟快速上手OBS多平台同步直播插件：告别重复配置，一键推流到多个平台【免费下载链接】obs-multi-rtmp OBS複数サイト同時配信プラグイン项目地址: https://gitcode.com/gh_mirrors/ob/obs-multi-rtmp 你是否曾经为在不同直播平台同步推流而烦…...

2026/5/28 13:32:26 阅读更多 →