完整RAG工作流达成！手把手教你使用NAS部署企业生产级AI知识库

张

张建站

2026/7/6 3:57:33

10分钟阅读

完整RAG工作流达成手把手教你使用NAS部署企业生产级AI知识库哈喽小伙伴们好我是Stark-C~之前给小伙伴们分享过多个可在NAS上私有化部署的知识库项目不过这些方案大多还是偏向于个人用户。虽说简单好用上手简单但深度不够如果是用作企业生产级比如说满足复杂文档解析、结构化切片、多路检索、重排、引用溯源、模型治理这些需求之前介绍的那些知识库项目还是差点意思。所以今天就给大家分享一个从底层架构就奔着企业级场景去设计的全能 RAG AI引擎--RAGFlow。用它来部署企业生产级知识库不仅能解决传统轻量工具在解析、切片、检索、溯源等方面的短板还能把模型管理、数据源同步、Agent 工具调用等能力整合到统一工作流中真正做到“生产可用”。话不多说直接带大家整起来关于RAGFlowRAGFlow 是 Infiniflow 开源的一体化 RAGRetrieval-Augmented Generation引擎目前已经在G站获得超过83.3k 的Star支持这个项目并不是简单的向量库 LLM 拼装而是整合了“深度文档理解可控切片多路检索可追溯引用强大 UI Agent 能力企业级数据源连接”的全能 RAG 引擎为企业提供知识库、智能客服、内部检索高质量、可验证、可调试的 AI 工作流项目Github地址https://github.com/infiniflow/ragflow项目亮点特色1深度文档理解RAGFlow能通过视觉模型解析复杂文档包括PDF、Word / PPT / Excel、图片、网页内容等它不仅 OCR还能识别标题层级、段落结构、表格、图文关系。2模板化切片它提供了针对书籍、论文、简历等不同内容类型的解析模板并利用NLP技术进行语义感知分块避免机械切割导致的上下文断裂、检索命中但上下文不完整等问题。3可追溯引用RAGFlow的回答可以精确定位到原文片段并提供可视化的 chunk 展示让用户知道答案来自哪里。4多路检索重排RAGFlow内置多策略检索、重排、多模型召回相比“向量库 LLM”的简单方案它能显著提升召回质量与答案准确性。5强大的模型管理RAGFlow拥有广泛的模型支持原生支持集成Ollama本地模型、OpenAI、Azure、ClaudeAnthropic等多种大语言模型。6内置 Agent 系统它还内置了可视化工作流引擎允许用户通过拖拽方式定义复杂的知识处理流程。这能实现如多跳推理分解复杂问题和异构数据融合联合检索数据库和文档等高级功能。RAGFlow部署1部署的前提条件RAGFlow的私有化部署对硬件是有要求的必须满足CPU≥ 4 核内存≥ 16 GB硬盘≥ 50 GBDocker版本 ≥ 24.0.0Docker Compose版本 ≥ v2.26.1我今天为大家演示的NAS为威联通Qu605六盘位大容量使用的是低功耗4核4线程的N150处理器标配16GB DDR5内存所以用来部署RAGFlow是完全没有任何问题的。2开始部署提前说明部署之前需要搞定网络全程都需要有【互联网】的支持先在Docker目录中威联通默认的Docker目录为“Container)新建一个“RagFlow”的文件夹然后开启威联通NAS的SSH连接位置在“控制台--网络和文件服务--Telnet/SSH”。然后随意使用一个终端工具连接到威联通NAS本文演示的工具为“FinalShell”。连上之后先通过“sudo -i”命令提权接着输入密码这里的密码就是NAS的登录密码输入密码没有显示输完之后直接回车即可。此界面直接输入“Q”回车。此界面输入“Y”回车。然后依次执行以下命令cd /share/Container/RagFlow # 进入NAS 的RagFlow目录具体以你自己的实际文件夹而定git clone https://github.com/infiniflow/ragflow.git #从 GitHub 把 RagFlow 项目下载到当前目录然后回到威联通的文件管理器打开设置将“显示NAS的隐藏文件”开启。终端工具不要关了接着打开“RagFlow--ragflow--docker”目录选中“.env”文件右键选择“重命名”。将它重命名为“.txt”。然后直接点开重命名后的“.txt”文件。威联通默认会通过Text Editor文本管理器打开如果没有就直接去应用商店安装我们需要做的就是将这里面和本地有冲突的端口也就是“PORT”后面的数字全部修改成不冲突的即可特别是我图中标出来的“SVR_WEB_HTTP_PORT”以及“SVR_WEB_HTTPS_PORT”是必改端口。完成之后点击右上角的“文件--保存”即可。然后回到文件管理器将“.txt”文件重新重命名为“.env”即可。接着再回到终端工具这边依次执行以下命令cd ragflow # 进入 ragflow 文件夹docker compose -f docker/docker-compose.yml up -d # 用 docker-compose 启动 ragflow然后系统就会自动拉取 ragflow 所需的Docker镜像这个时候请务必保持畅通的【互联网】。我这边因为之前所需的镜像已经提前拉取到本地所以这里是直接启动程序了。完成之后回到威联通的Container Station中可以看到RAGFlow总共运行了5个相关容器。RAGFlow体验RAGFlow的主程序容器为“docker-ragflow-cpu-1”点开这个容器之后80端口映射的就是它的Web页面打开端口。其实就是我们在“.env”中修改的“SVR_WEB_HTTP_PORT”端口刚打开的时候会看到502报错这是正常的因为此时mysql数据库还没有跑起来。稍等一会大概一分钟左右该页面会自动打开登录页面就说明所有的工作准备就绪可以使用了。我们先点“Sign up”注册一个账号。注册很简单随便设置一个邮箱、用户名以及用户密码即可。然后使用注册的邮箱和密码登录。登录进来后可以先将语言设置为简体中文。还可以切换主题模式。点击右上角的用户图标先来设置AI大模型。在“模型提供商”里可以看到它提供的模型服务商挺多的甚至还内置了硅基流动这种综合类多模态模型服务商。我这里就以硅基流动为例直接粘贴API-Key之后就可以了。像硅基流动这种综合类 AI 大模型提供商最大的好处就是一个 API Key可以使用多种不同类型的大模型从对话、嵌入到图像理解、视频分析、语音识别、结构化抽取、Rerank 重排等全链路能力都能统一调用大幅降低了接入成本。PS硅基流动拥有极其丰富的模型矩阵包括语言、图像、视频、语音等均有涉及。硅基流动目前有活动所有用户在注册后首次完成有效实名认证即可获得1 张面值 ¥16 的全站通用「认证奖励券」之后就能免费体验一段时间任意大模型。活动可以通过官网或者我的邀请链接【https://cloud.siliconflow.cn/i/BsoAsvvg】获取。简单演示下创建知识库。选择首页的“知识库”之后再点“添加”按钮。为知识库命名然后选中一个嵌入模型就可以了。创建好之后就可以上传文件。文件是以拖拽上传的形式支持多个单个文件一起上传也支持直接上传文件夹。我这里直接上传了我平时创作的Markdown文件夹。上传之后这里会以列表的形式呈现并且我在上步勾选了“创建时解析”实测解析的速度还是挺快的6篇文章不到一分钟全部解析完成。随便点开一个可以看到是完美识别的并且还有切片效果。我个人比较喜欢它的知识图谱它会根据我们上传的所有文章自动抽取关键概念、实体与关系并将它们组织成一张可视化的知识结构网络让我们一眼就能看到哪些内容是相关的、哪些主题是核心。聊天的时候如果想优先启用知识库需要在设置中奖我们的知识库手动添加进来。这样我们在提问时它就会自动关联知识库内容给出经过检索与理解后的精准回答。总结我文中展示的只是RAGFlow最最基础的功能因为我个人其实是用不到这么强大的知识库管理系统所以只挑了最容易上手的部分来演示。至于其它至于其它那些真正面向企业级的高级能力比如核心的多策略检索与重排、复杂文档的结构化解析灯功能就留给真正需要的小伙伴自行挖掘吧~好了以上就是今天给大家分享的内容我是爱分享的Stark-C如果今天的内容对你有帮助请记得收藏顺便点点关注咱们下期再见谢谢大家~

PowerShell 路径规则详解：从基础到高级

1. 引言在 Windows 系统管理和自动化脚本编写中，PowerShell 是功能强大的工具。无论是访问文件、加载模块，还是执行脚本，都离不开对路径的正确理解和处理。PowerShell 的路径规则与传统的 CMD 有所不同，它更灵活，但也更…...

2026/7/6 3:57:12 阅读更多 →

AI 学习笔记：关于 Hermes Agent 的补充

tokens 以内。Hermes Agent 会在每次启动一个会话时将其冻结为快照，并注入系统提示词，确保关键上下文不丢失。例如在代码调试场景中，这样做能精准保留错误堆栈、变量状态等核心信息。 L2 用户画像：相关记忆数据存储于USER.md文件…...

2026/7/6 3:54:58 阅读更多 →

库存并发安全控制的架构设计

库存并发安全控制的架构设计 1 概述 1.1 业务场景电商商品在高并发下单、秒杀、订单发货出库、订单超时取消场景下，多请求并行读写库存会出现超卖、库存负数、冻结库存数据错乱等数据一致性问题。本文提供三套成熟并发控制方案，保障库存操作安全。 1.2 库存计算规则系…...

2026/7/6 3:53:20 阅读更多 →

从论文到实践：一维卷积神经网络在RUL预测中的复现与调优

1. 为什么选择一维卷积做RUL预测？我第一次接触RUL（剩余使用寿命）预测时，发现大多数论文都在用二维卷积处理传感器数据。直到实际处理CMAPSS航空发动机数据集时，才意识到一维卷积才是更自然的选择。想象一下&#xff0c…...

2026/7/5 0:01:14 阅读更多 →

STM32与SPI EEPROM高效数据存储与检索方案

1. 项目背景与核心需求在嵌入式系统开发中，快速精确的数据检索是一个常见但极具挑战性的需求。特别是在工业控制、医疗设备和物联网终端等场景下，系统往往需要在毫秒级时间内完成关键参数的读取和写入操作。传统基于Flash存储的方案存在擦写次数有限、操…...

2026/7/6 0:17:35 阅读更多 →

23-AGENTS.md高级用法

23 AGENTS.md 高级用法概述上一篇文章介绍了 AGENTS.md 的三层加载机制，这是 AGENTS.md 体系的基础。但在实际的大型项目中，三层结构往往不够灵活。团队经常面临这样的场景：同一个 Git 仓库中包含多个服务或模块，每个模块都有自己的独特规范，同时还要继承项目级的通用…...

2026/7/5 0:06:48 阅读更多 →