腾讯模型广场DeepSeek 这种热门模型:腾讯云有自己部署,其它小厂第三方模型(百川、智谱等):走对方 API 转发
估计腾讯这些第三方的模型全是免费的自已建了服务器来处理搜索 3 个关键词参考 18 篇资料先把结论讲清楚不是免费、不是腾讯自己 “建服务器处理所有第三方模型”也不是白嫖 DeepSeek。下面分三块说结合 2026-05 最新情况一、QQ / TokenHub 上的第三方模型如 deepseek-v4-flash是怎么跑的腾讯这边是混合模式DeepSeek 这种热门模型腾讯云有自己部署自建服务器腾讯云 TI-ONE / TokenHub 上DeepSeek 系列是腾讯自己买卡、自己搭 GPU 集群部署的。用的是腾讯云自己的 H800 / H20 服务器不是调用 DeepSeek 官网 API。但模型本身不是腾讯 “自己开发”是 DeepSeek 开源 / 授权腾讯本地私有化部署。其它小厂第三方模型百川、智谱等走对方 API 转发腾讯只是做聚合平台你发请求 → 腾讯 → 转发给百川 / 智谱 API → 结果返回给你。这种腾讯不自建服务器跑模型只是通道。一句话DeepSeek、混元腾讯自己服务器跑其它第三方大多是转发别人 API二、是不是 “免费”——绝对不是免费只是便宜你看到 “便宜 / 好像不扣钱”原因是deepseek-v4-flash 本身定价极低2026-05输入未命中缓存1 元 / 百万 token输入命中 KV 缓存0.02 元 / 百万 token几乎等于不要钱输出2 元 / 百万 token→ 你单轮短问题一次就几十个 token一次几分钱甚至几厘钱账单上几乎无感。QQ/TokenHub 给新用户有免费额度新号有几十万–几百万免费 token你前期用着感觉 “不扣钱”。额度用完照样按量计费只是单价低。你 VB6 每次都是独立单轮请求 加了 prompt_cache_key很容易命中KV 前缀缓存→输入 0.02 元 / 百万便宜到你以为免费。但本质没有 “永久免费”没有 “不扣 token”没有 “腾讯自己随便跑不花钱”腾讯自己部署 DeepSeek要花巨额 GPU 服务器成本不可能白给你用。三、你关心的为什么每次都要连 deepseek-v4-flash不能直接返回缓存关键点要区分平台 KV 缓存你现在用的作用同一个前缀不用重复计算 encoder省算力、降输入费用限制必须走模型推理、必须计费哪怕极便宜、不能直接返回旧答案它是推理加速缓存不是 “问答结果缓存”你想要的 “同问题直接返回答案、0 token”腾讯平台本身不提供只能你自己在 VB6 做一层 “问题→答案” 本地缓存内存 / 文件流程查本地缓存 → 有 → 直接返回0 token、不碰 deepseek无 → 发请求 → 存缓存 → 返回四、一句话总结直接回答你原问题第三方模型不是免费deepseek-v4-flash 便宜到几乎无感但按量计费不是白嫖。腾讯自建服务器对 DeepSeek 这种主力模型腾讯自己买 GPU 部署不是转发官网 API。但腾讯不是 “自己开发”是拿 DeepSeek 模型自己私有化部署。平台没有 “0 token 结果缓存”只有便宜的 KV 输入缓存想完全不扣 token只能你自己 VB6 做本地结果缓存。如果你愿意我可以把VB6 本地缓存内存 文件持久化直接写成一个完整模块你直接复制就能用同问题永远 0 token、不走 deepseek。要不要deepseek-v4-flash 本身定价极低2026-05输入未命中缓存1 元 / 百万 token那免费100万其实只是送了你一元钱搜索 2 个关键词参考 12 篇资料可以这么理解但要把账算得更细一点按 2026-05 国内公开价1. DeepSeek‑V4‑Flash 官方定价人民币输入未命中缓存1 元 / 百万 token输入命中 KV 缓存0.02 元 / 百万 token输出2 元 / 百万 token2. QQ/TokenHub 新用户免费额度DeepSeek‑V4‑Flash100 万 token输入 输出合计有效期 90 天3. 你的疑问“免费 100 万 只送 1 元”如果你全是输入、且从不命中缓存100 万输入 × 1 元 / 百万 1 元但实际使用一定会有输出 token2 元 / 百万命中缓存的输入0.02 元 / 百万举个典型例子单轮短问答输入100 token → 0.0001 元输出300 token → 0.0006 元一次合计0.0007 元100 万免费额度按这种比例用大概能跑几千到几万次总价值远不止 1 元因为大头是输出。4. 结论纯 “未命中缓存的输入” 维度100 万 ≈ 1 元你这个理解是对的。实际使用有输出、有缓存命中100 万额度的实际价值大概在 23 元左右但因为每次扣费都是 “厘” 级体感几乎等于免费。平台本质不是送你 1 元钱而是送你 100 万 token 的调用额度单价极低用完再按量计费。要不要我帮你做一个 “每次调用大概花多少钱、100 万能用多少次” 的速算表你以后心里有数