免费开源AI软件.桌面单机版，可移动的AI知识库，察元 AI桌面版:全模型支持的第一个例子给察元AI挂上Ollama的下午

张

张建站

2026/5/12 21:24:16

10分钟阅读

免费开源AI软件.桌面单机版，可移动的AI知识库，察元 AI桌面版:全模型支持的第一个例子给察元AI挂上Ollama的下午

全模型支持的第一个例子给察元AI挂上Ollama的下午很多人对察元AI 桌面单机版的第一个误解是默认要联网用 OpenAI 的钥匙才能跑。其实并不。chayuan-desktop 的网关层在设计时就把本地推理放在和厂商云一样的位置这一篇用 Ollama 做演示说一下完整的接入过程让本地离线知识库加本地大模型的组合在一台普通电脑上跑通。为什么先选 Ollama。它把模型权重的下载、运行、API 暴露这三件事都打包了不用自己折腾 llama.cpp 命令行也不用自己装 CUDA 工具链。安装包在 ollama.com 拿一路下一步。装完后命令行运行 ollama pull qwen2.5:7b 把一个国产模型权重拉下来再运行 ollama serve 起服务本地的 11434 端口会暴露一个 OpenAI 兼容的接口。接到 chayuan-desktop。打开主界面右上的设置进模型供应商新建一个 OpenAI 兼容路由的供应商。地址填 http://127.0.0.1:11434/v1钥匙随便填一个非空字符串因为 Ollama 默认不校验。点保存察元AI 会去探测 /v1/models把 qwen2.5:7b 这条记录拉回来。在对话切换器里就能选到这个本地模型。第一句对话试一下。问一句日常问题看看流式输出是否正常、tokens/s 大致多少。我那台 i5 加 16G 的电脑上 7B 模型 CPU 跑大概 6-8 tokens/s不快但是能用。如果你有显卡Ollama 会自动用 GPU。接知识库这一段更值得讲。把一份 PDF 拖进对话窗口触发一次文档 RAG 入库。chayuan-desktop 默认用的是内嵌的 bge-m3-onnx 嵌入模型跑在 CPU 上做嵌入计算。重排可以选择跳过或者也走本地。整个 RAG 链路在 sidecar 进程内闭环模型推理走 Ollama嵌入走 ONNX向量库是 sqlite-vec。整套链路里一次外网调用都没有发生。接下来是想象一下整套组合的好处。第一模型钥匙不再是必需品单机版可以彻底不联外网第二私有文档完全不出本机第三跟 chayuan-wps WPS AI 插件共用同一份 KB 和模型配置加载项调起来的对话也走 Ollama体验一致第四等你有了显卡把模型规模升到 14B 或 32B整个流程不需要重新走只需要重新拉一份权重并在 Ollama 里切换。需要注意几个细节。Ollama 默认会启动后台服务重启 chayuan-desktop 不会重启它端口冲突的可能性要排查Ollama 的模型路径默认在 ~/.ollama磁盘空间要预留Ollama 的并发窗口默认有限一次问答里多 Tab 同时跑会排队体感上像变慢Ollama 不支持函数调用 tools 的所有模型遇到工具调用的对话场景要选合适的模型权重。如果你已经熟悉 LM Studio、vLLM、Xinference这套接入方式同样可用OpenAI 兼容路由是 chayuan-desktop 网关层的统一接入点。差别只在于模型规模和性能链路本身一致。免费开源的AI软件加上本地推理凑成一台真正完全自己掌控的 AI 工作站最大障碍其实是模型权重的下载而不是 chayuan-desktop 这一边。下午搞定剩下的就是拿来用。

告别龟速下载！实测对比Axel、Aria2、mwget三大神器，教你选对多线程工具

三大命令行下载神器深度横评：Axel、Aria2与mwget的性能对决当你在终端里反复输入wget或curl命令，盯着缓慢增长的进度条时，是否想过还有更高效的解决方案？本文将带你深入探索Axel、Aria2和mwget这三款命令行下载加速工具&#xff…...

2026/5/12 21:17:47 阅读更多 →

告别桌面混乱！Ubuntu 16.04 多桌面+Terminator分屏，打造程序员高效工作流

Ubuntu 16.04多桌面与Terminator分屏：构建程序员的高效工作流作为一名长期在Ubuntu环境下工作的开发者，我深刻体会到工作环境配置对效率的影响。桌面混乱、窗口堆叠、频繁切换不仅浪费时间，还会打断编程的"心流"状态。经过多次迭代…...

2026/5/12 21:17:46 阅读更多 →

使用python快速接入taotoken调用多个主流大模型

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度使用Python快速接入Taotoken调用多个主流大模型对于希望便捷使用多家大模型服务的Python开发者而言，Taotoken提供了一…...

2026/5/12 21:14:02 阅读更多 →

4月28日隐喻“鲸鱼开眼”，DeepSeek识图模式灰度上线，迈入图文交互时代！

4月28日，DeepSeek多模态团队研究员推文隐喻“鲸鱼开眼”，次日开启“识图模式”灰度内测，5月初大范围开放。该模式有亮点也有短板，标志其迈入图文交互时代。事件回顾4月28日，DeepSeek多模态团队研究员陈小康在X平台推文…...

2026/5/12 16:00:30 阅读更多 →

AI赋能高能物理：图神经网络与生成式模型在粒子径迹重建与模拟中的应用

1. 项目概述：当AI遇见高能物理的“显微镜”电子离子对撞机（EIC），被誉为探索物质深层结构的下一代“超级显微镜”。它不像我们熟悉的LHC那样让质子对撞，而是让高能电子去轰击质子或重离子，其核心目标是精确“…...

2026/5/11 20:47:18 阅读更多 →

A/B 测试前后的合成控制样本

原文：towardsdatascience.com/synthetic-control-sample-for-before-and-after-a-b-test-683bac36ffc1 简介 A/B 测试非常强大。我喜欢这种实验，因为它让我们能够比较结果，并确定某物是否比另一物表现更好。 A/B 测试有一个特定类型&#x…...

2026/5/12 5:49:54 阅读更多 →