零成本搭建OpenAI API代理：基于Cloudflare Workers的稳定访问方案

张

张建站

2026/5/12 23:56:51

10分钟阅读

零成本搭建OpenAI API代理：基于Cloudflare Workers的稳定访问方案

1. 项目概述与核心价值最近在折腾AI应用开发的朋友估计都绕不开一个头疼的问题OpenAI的官方API接口在国内网络环境下访问起来不太稳定时不时就给你来个连接超时或者直接被墙。我自己在做一些个人项目和小工具时也经常被这个问题卡住调试起来非常费劲。后来在GitHub上发现了x-dr大佬开源的chatgptProxyAPI项目它提供了一种非常巧妙的思路——利用Cloudflare的边缘网络服务来中转OpenAI的API请求完美解决了这个痛点。简单来说这个项目就是一个部署在Cloudflare Workers或Cloudflare Pages上的反向代理。它接收你的应用发起的请求然后帮你转发到真正的api.openai.com再把响应返回给你。由于Cloudflare在全球有海量的边缘节点其中不少节点在国内访问速度不错且相对稳定这就相当于给你的API调用铺了一条“高速公路”。最吸引人的是Cloudflare Workers和Pages的免费套餐额度对于个人开发者和小规模使用来说完全够用这意味着你可以零成本搭建一个属于自己的、稳定的OpenAI API代理服务。这个方案特别适合几类人一是个人开发者或学生想低成本、稳定地调用GPT接口来开发学习项目二是中小团队在内部搭建一些AI辅助工具又不想在代理服务器上投入额外成本三是任何被OpenAI API地域限制困扰需要找一个可靠中转方案的朋友。接下来我就结合自己的部署和使用经验把这个项目的核心原理、几种部署方式以及实际使用中的各种细节和坑点给大家掰开揉碎了讲清楚。2. 核心原理与方案选型解析2.1 为什么需要代理Cloudflare方案的优势在哪直接调用api.openai.com遇到问题根本原因在于网络链路。你的请求可能需要经过多个国际网关其中任何一个环节不稳定或被限制都会导致失败。传统的解决方案是自建代理服务器比如租用一台海外VPS在上面搭建Nginx反向代理或专门的代理软件。但这有几个问题首先VPS有成本其次你需要维护这台服务器保证其稳定和安全最后单台服务器的地理位置固定可能无法为所有地区的用户都提供良好体验。Cloudflare Workers的方案则完全不同。它属于“Serverless”架构你的代码不是运行在某台特定的服务器上而是部署在Cloudflare全球的边缘网络上。当用户发起请求时Cloudflare会自动将请求路由到离用户最近、性能最优的边缘节点去执行你的Worker代码。这带来了几个核心优势全球加速与高可用依托Cloudflare庞大的CDN网络请求可以从离用户最近的节点发出到OpenAI服务器的网络路径可能更优延迟更低稳定性也更有保障。同时边缘网络天生具备高可用性单点故障风险极低。真正的零成本起步Cloudflare Workers免费套餐每天提供10万次请求这对于个人开发、测试甚至小规模生产使用都绰绰有余。Cloudflare Pages同样有免费的构建和托管额度。无需运维你不需要关心服务器操作系统、运行时环境、安全补丁等问题只需要关注业务逻辑代码。开发体验好基于JavaScript/TypeScript对于前端开发者或Node.js开发者来说非常友好调试和部署流程也相对简单。chatgptProxyAPI项目的核心代码无论是Worker版本还是Pages版本本质上都是一段轻量级的HTTP代理逻辑。它解析客户端发来的请求保留必要的头部信息特别是Authorization然后将请求体原封不动地转发给api.openai.com最后将响应返回给客户端。这个过程对客户端几乎是透明的你只需要把请求的域名从api.openai.com换成你自己的代理域名即可。2.2 三种部署方式深度对比项目提供了三种主流的部署方式Cloudflare Workers、Cloudflare Pages以及Docker部署。选择哪种取决于你的具体需求和技术栈。Cloudflare Workers这是最经典、最轻量的方案。你只需要一个Cloudflare账户创建一个Worker粘贴一段JS代码即可。它的特点是极致轻快纯函数计算冷启动速度快资源消耗极低。配置简单几乎不需要额外的配置专注于代理逻辑本身。适合场景需要快速搭建一个纯净的API代理或者希望将代理逻辑作为更大Worker应用的一部分。Cloudflare Pages这个方案更适合需要部署一个“网站”或“Web应用”的场景。chatgptProxyAPI的Pages版本实际上包含了一个前端演示界面用于测试和后端API代理。它的特点是一体化部署可以同时托管前端静态页面和后端Serverless函数Pages Functions。更适合前端项目如果你希望有一个界面来展示代理状态、进行简单的对话测试Pages是更好的选择。构建集成可以与Git仓库集成实现自动部署。Docker部署这是在自有海外VPS上运行的方案。你需要一台可以访问OpenAI的服务器然后在上面运行项目提供的Docker镜像。它的特点是完全自控所有流量经过你自己的服务器数据路径完全可控。功能可能受限根据项目描述此方式可能不支持Server-Sent Events这对于需要流式响应一个字一个字往外蹦的聊天场景是个硬伤。适合场景已有稳定海外VPS且对Docker运维熟悉同时不依赖流式输出的团队。注意对于绝大多数个人开发者和中小项目我强烈推荐Cloudflare Workers方案。它最简单、最直接、成本最低并且能完整支持OpenAI API的所有功能包括流式输出。Pages方案适合想附带一个测试页面的情况。Docker方案除非有特殊管控需求否则不推荐作为首选。3. 基于Cloudflare Workers的部署实操详解这是我最推荐也是步骤最清晰的一种方式。下面我以从头开始创建一个Worker为例详细走一遍流程。3.1 前期准备与账号设置首先你需要一个Cloudflare账户。如果还没有去官网注册一个过程很简单。注册完成后你需要添加一个域名到Cloudflare进行托管。这是关键一步因为免费的Worker服务只能通过绑定自定义域名来访问*.workers.dev域名在某些地区访问不稳定。登录Cloudflare仪表板点击“添加站点”。输入你的域名例如yourdomain.com选择免费计划。按照提示去你的域名注册商那里将域名的NS名称服务器记录修改为Cloudflare提供的地址。这个过程通常需要几分钟到几小时生效等待Cloudflare检测到生效即可。域名状态变为“有效”后准备工作就完成了。3.2 Worker创建、部署与绑定域名在Cloudflare仪表板侧边栏找到“Workers Pages”并点击进入。点击“创建应用程序”然后选择“创建Worker”。你会进入一个在线代码编辑器界面。将左侧默认的代码全部删除。打开项目提供的cf_worker.js文件。你可以直接访问这个链接复制里面的全部代码。将复制的代码粘贴到Cloudflare Worker的编辑器中。代码不长核心逻辑就是捕获请求、改写目标URL、添加必要的请求头、然后转发。点击右下角的“部署”按钮。部署成功后系统会分配一个*.workers.dev的临时域名比如your-worker.your-account.workers.dev。你可以先点击这个链接测试一下如果返回“Worker deployed successfully”之类的信息说明基础Worker运行正常。关键步骤绑定自定义域名。在Worker的管理页面找到“触发器”选项卡。在“自定义域”部分点击“添加自定义域”。输入你想要用于代理的域名例如openai.yourdomain.com。Cloudflare会自动为你创建一条CNAME记录。确认添加。稍等片刻等待DNS记录生效。你可以通过ping openai.yourdomain.com来测试是否已指向Cloudflare的IP。至此你的私有OpenAI API代理就搭建完成了。你的API端点现在是https://openai.yourdomain.com。3.3 代码逻辑解析与安全注意事项部署虽然简单但理解一下Worker的代码在做什么很重要这有助于后续排查问题。我们简单看下cf_worker.js的核心部分以项目代码为准此处为原理说明addEventListener(fetch, event { event.respondWith(handleRequest(event.request)) }) async function handleRequest(request) { const url new URL(request.url) // 1. 替换目标主机将我们代理域名的请求目标改为 api.openai.com url.hostname api.openai.com // 2. 构造新的请求保留原始方法、头部、体 const modifiedRequest new Request(url.toString(), { method: request.method, headers: request.headers, body: request.body, redirect: follow }) // 3. 发起请求并获取响应 const response await fetch(modifiedRequest) // 4. 创建新的响应确保CORS头部正确以便浏览器跨域访问 const modifiedResponse new Response(response.body, response) modifiedResponse.headers.set(Access-Control-Allow-Origin, *) modifiedResponse.headers.set(Access-Control-Allow-Methods, GET, POST, PUT, DELETE, OPTIONS) modifiedResponse.headers.set(Access-Control-Allow-Headers, *) return modifiedResponse }安全与使用注意事项API Key保护这个代理是透明的你的API Key会通过Authorization请求头原样传递给OpenAI。务必确保你的前端代码不会意外泄露API Key。永远不要将写有API Key的代码提交到公开仓库。在生产环境中应该通过你自己的后端服务器来中转请求由后端持有API Key前端只与你的后端通信。速率限制Cloudflare Workers和OpenAI本身都有速率限制。虽然免费额度够用但如果你突然发起大量请求可能会被限制。建议在你的应用代码中加入适当的延迟和错误重试机制。日志与监控免费Worker的日志功能有限。对于重要的生产应用可以考虑在Worker代码中添加简单的日志逻辑将请求摘要发送到外部日志服务以便排查问题。域名选择尽量使用独立的子域名如openai.yourdomain.com来部署这个代理不要跟你的主站混用。这样在管理和安全策略配置上会更清晰。4. 基于Cloudflare Pages的部署与功能集成如果你希望不仅有一个代理后端还想有一个简单的前端页面来测试代理是否工作那么Pages部署方式是更好的选择。它把前端静态资源和后端API代理逻辑打包在一起部署。4.1 从模板创建到一键部署Pages的部署流程非常“GitHub风格”与很多静态站点托管服务类似。访问项目的GitHub页面点击绿色的“Use this template”按钮。这会在你的GitHub账户下创建一个属于你的新仓库副本而不是简单的Fork这样你可以自由修改而不会影响原项目。给你的新仓库起个名字然后创建它。登录Cloudflare仪表板进入“Workers Pages”。点击“创建应用程序” - “Pages” - “连接到Git”。授权Cloudflare访问你的GitHub账户然后选择你刚刚创建的那个仓库。在配置构建和部署的页面项目已经预设好了配置通常无需修改生产分支main或master。构建命令npm run build项目使用Vite等工具构建前端。构建输出目录dist。点击“保存并部署”。Cloudflare会自动拉取代码、安装依赖、执行构建并将产物部署到全球网络。部署完成后你会获得一个*.pages.dev的域名。同样地为了稳定访问我强烈建议你为这个Pages项目绑定一个自定义域名。在Pages项目的设置中可以找到“自定义域”选项进行添加。部署完成后访问你的域名你应该能看到一个类似项目Demo站点的聊天界面。这个界面本身就会使用你刚刚部署的Pages后端作为API代理。这意味着你的前端和后端代理是配套工作的。4.2 Pages Functions 代理原理剖析Pages方案的后端代理逻辑是通过Cloudflare Pages的“Functions”功能实现的。它允许你在/functions目录下放置服务器端JavaScript代码这些代码会自动作为对应路由的API端点。在chatgptProxyAPI项目中关键的代理逻辑位于/functions/api/[[path]].js。这是一个“动态路径”函数它会捕获所有发往/api/*路径的请求。其核心逻辑与Worker版本类似但因为是作为Pages Function运行所以集成在同一个项目中管理起来更方便。这种架构的好处是你可以将测试前端和代理后端作为一个整体项目进行版本管理和部署。当你更新前端界面时代理逻辑也会同步更新。4.3 仅部署代理后端剥离前端也许你只想要API代理功能不想要那个前端界面。项目也提供了教程。核心思路是修改Pages的构建配置或者使用一个更精简的仓库分支。通常你需要检查项目仓库的docs/cloudflare_proxy_pages.md文件里面可能有专门的配置说明。或者你可以手动调整。在Cloudflare Pages的部署配置中将“构建命令”改为一个不生成前端产物的命令比如echo “No build”并将“构建输出目录”改为一个不存在的目录或根目录。确保/functions目录下的代理逻辑文件正确存在。这样部署后你的Pages站点将只提供API功能返回的可能是一个404页面或空白页但https://your-pages-domain.com/api/*这个接口是正常工作的。你可以像使用Worker代理一样使用它。实操心得对于大多数只想用代理功能的开发者我仍然认为单独的Worker方案更纯粹、更省心。Pages方案更适合那些确实需要那个内置测试页面或者想把前端Demo和代理一起打包分发给其他人的场景。5. 客户端集成与多语言调用示例代理服务搭好了关键在于怎么用。这里的关键点就一句话把你原来调用https://api.openai.com/v1/...的地方全部替换成你的代理域名https://your-proxy-domain.com/v1/...。/v1这个路径前缀通常需要保留。下面我用几个最常见的语言和库来举例说明。5.1 原生Fetch (JavaScript) 与 Python Requests这是最直接的方式适用于任何能发送HTTP请求的环境。JavaScript (Fetch API):const apiKey ‘sk-your-actual-openai-api-key-here’; // 注意前端暴露Key有风险 const proxyUrl ‘https://openai.yourdomain.com’; // 你的代理地址 async function callGPT() { const response await fetch(${proxyUrl}/v1/chat/completions, { method: ‘POST’, headers: { ‘Authorization’: Bearer ${apiKey}, ‘Content-Type’: ‘application/json’ }, body: JSON.stringify({ model: ‘gpt-3.5-turbo’, messages: [{ role: ‘user’, content: ‘Hello, how are you?’ }], stream: true // 如果需要流式响应 }) }); // 处理流式响应 if (response.body response.ok) { const reader response.body.getReader(); const decoder new TextDecoder(); while (true) { const { done, value } await reader.read(); if (done) break; const chunk decoder.decode(value); // 处理每个chunk通常是SSE格式 console.log(chunk); } } else { const data await response.json(); console.log(data.choices[0].message.content); } }Python (Requests库):import requests import json api_key “sk-your-actual-openai-api-key-here” proxy_url “https://openai.yourdomain.com” url f“{proxy_url}/v1/chat/completions” headers { “Authorization”: f“Bearer {api_key}”, “Content-Type”: “application/json” } payload { “model”: “gpt-3.5-turbo”, “messages”: [{“role”: “user”, “content”: “Hello, how are you?”}] } # 非流式请求 response requests.post(url, headersheaders, jsonpayload) if response.status_code 200: data response.json() print(data[“choices”][0][“message”][“content”]) else: print(f“Error: {response.status_code}”, response.text) # 流式请求 (需要requests2.28.0并处理SSE) # 流式处理稍复杂通常使用‘sseclient’等库此处不展开。5.2 使用流行的 OpenAI SDK 或第三方库很多开发者喜欢使用封装好的SDK比如官方的openaiNode.js/Python库或者社区优秀的chatgpt-api。这些库通常支持自定义baseURL或apiBaseUrl。Node.js 使用openai官方库:import OpenAI from ‘openai’; const client new OpenAI({ apiKey: ‘sk-your-actual-openai-api-key-here’, baseURL: ‘https://openai.yourdomain.com/v1’, // 关键在这里指定代理地址 }); async function main() { const completion await client.chat.completions.create({ model: ‘gpt-3.5-turbo’, messages: [{ role: ‘user’, content: ‘Hello!’ }], }); console.log(completion.choices[0].message); } main();使用社区chatgpt-api库 (如项目示例):import { ChatGPTAPI } from ‘chatgpt’; const api new ChatGPTAPI({ apiKey: “sk-your-actual-openai-api-key-here”, apiBaseUrl: “https://openai.yourdomain.com/v1” // 同样指定基础URL }); const res await api.sendMessage(‘Hello World!’); console.log(res.text);5.3 查询API余额与用量管理API密钥监控用量是必不可少的。OpenAI提供了相关的接口通过代理一样可以调用。async function checkBilling(apiKey, proxyUrl) { const headers { ‘Authorization’: Bearer ${apiKey}, ‘Content-Type’: ‘application/json’ }; // 1. 查询订阅信息 const subRes await fetch(${proxyUrl}/v1/dashboard/billing/subscription, { headers }); const subData await subRes.json(); console.log(‘账户类型:’, subData.plan.id); // 例如 free 或 paid console.log(‘到期时间:’, new Date(subData.access_until * 1000).toLocaleString()); // 2. 查询用量最近90天 const endDate Math.floor(Date.now() / 1000); // 当前时间戳 const startDate endDate - 90 * 24 * 60 * 60; // 90天前 const usageRes await fetch( ${proxyUrl}/v1/dashboard/billing/usage?start_date${startDate}end_date${endDate}, { headers } ); const usageData await usageRes.json(); console.log(‘总使用金额美分:’, usageData.total_usage); // 计算大约消耗了多少美元 console.log(‘≈$’, (usageData.total_usage / 100).toFixed(2)); }重要提示余额查询接口可能需要特定的权限并且格式可能随时间变化。上述代码是示例请以OpenAI官方文档为准。另外频繁查询可能会消耗少量API额度。6. 常见问题、性能调优与排查指南在实际使用中你可能会遇到一些问题。这里我整理了一些常见的情况和解决办法。6.1 连接超时与速率限制症状请求长时间无响应最终报超时错误或者返回429 Too Many Requests。可能原因与解决Cloudflare Worker冷启动免费Worker在闲置一段时间后会被“休眠”首次请求会有约几百毫秒的冷启动延迟。这是正常的持续有请求后就会保持热状态。OpenAI API速率限制每个API Key都有每分钟、每天的请求次数和Token数量限制。如果你超限了就会收到429错误。解决方案在客户端代码中加入指数退避重试机制并监控你的用量。Cloudflare自身限制免费Worker每日10万次请求每秒最多1000次。对于个人使用几乎不可能触发。但如果你的应用突然爆火可能会遇到。需要升级到付费计划。网络抖动虽然用了Cloudflare但到OpenAI服务器的最后一跳仍然可能不稳定。可以尝试在Worker代码中增加一点超时和重试逻辑需谨慎避免循环。6.2 流式响应 (Streaming) 中断症状在聊天时设置了stream: true但响应流中途断开内容不完整。排查检查Worker代码确保你的Worker代码正确处理了流式响应。原始的cf_worker.js代码是透传响应体的应该支持流式。但如果你修改过代码特别是如果用了await response.text()或await response.json()就会缓冲整个响应破坏流式。检查客户端客户端处理Server-Sent Events (SSE)的代码是否正确网络连接是否稳定超时设置长时间流式响应可能会被某些中间网络设备或服务器超时设置切断。Cloudflare Worker默认有100秒的执行超时限制对于极长的流式对话可能不够。可以考虑升级到付费Worker以获得更长的超时时间。6.3 跨域 (CORS) 问题症状在浏览器中通过JavaScript调用代理接口时控制台报CORS错误。解决项目自带的Worker代码已经设置了宽松的CORS头部Access-Control-Allow-Origin: *。如果还有问题请检查你的代理地址是否正确HTTPS。浏览器是否缓存了旧的、没有CORS头的响应尝试强制刷新或清空缓存。对于OPTIONS预检请求Worker代码也需要正确处理。示例代码中通常能处理如果不行可以在Worker中显式处理OPTIONS方法返回允许的头部。6.4 性能优化建议使用HTTP/2 或 HTTP/3Cloudflare默认支持。确保你的客户端也支持这能提升大量小请求的性能对流式响应尤其有益。减少不必要的请求头在转发请求时Worker可以过滤掉一些客户端带来的、OpenAI API不需要的头部减少请求体积。考虑地理位置虽然Cloudflare自动选择节点但如果你知道你的用户主要来自某个区域可以在Cloudflare的域名设置中调整“区域”的缓存或SSL/TLS模式但这对Worker执行位置影响不大。监控与告警利用Cloudflare的免费分析功能查看Worker的调用次数、错误率和执行时间。如果错误率升高或耗时变长可能是上游OpenAI API或网络出了问题。6.5 一个实用的调试技巧当遇到问题时最快的方法是直接测试你的代理端点。你可以使用curl命令curl -X POST \ -H “Authorization: Bearer sk-your-test-key” \ -H “Content-Type: application/json” \ -d ‘{\“model\”: \“gpt-3.5-turbo\”, \“messages\”: [{\“role\”: \“user\”, \“content\”: \“Hi\”}]}’ \ https://openai.yourdomain.com/v1/chat/completions观察返回的结果。如果返回OpenAI的原生错误如invalid_api_key说明代理工作正常问题出在API Key或请求参数上。如果返回Cloudflare的错误如5xx错误或者连接失败那问题就出在代理服务本身或网络链路上。最后再强调一次前端直接使用API Key风险极高。这个代理方案最适合的场景是1个人学习测试2你的自有后端服务调用后端持有Key前端调用后端。千万不要在网页或移动端App的源码中硬编码有效的API Key。

告别百度网盘限速：3步解锁全平台高速下载新体验

告别百度网盘限速：3步解锁全平台高速下载新体验【免费下载链接】baidupcs-web 项目地址: https://gitcode.com/gh_mirrors/ba/baidupcs-web 你是否曾经在深夜焦急等待一个重要文件下载完成，而进度条却像蜗牛一样缓慢爬行？是否因为百…...

2026/5/12 23:55:22 阅读更多 →

终极免费实时屏幕翻译工具：Translumo全面指南

终极免费实时屏幕翻译工具：Translumo全面指南【免费下载链接】Translumo Advanced real-time screen translator for games, hardcoded subtitles in videos, static text and etc. 项目地址: https://gitcode.com/gh_mirrors/tr/Translumo 你是否在玩外语游…...

2026/5/12 23:53:17 阅读更多 →

AgentBoard：AI辅助开发的macOS驾驶舱，整合任务、对话与监控

1. 项目概述：一个为AI辅助开发而生的“驾驶舱” 如果你和我一样，每天都在和AI编程助手（比如Claude、Cursor、GPT Engineer等）打交道，那你一定对那种“精神分裂”般的工作状态深有体会。左手边是终端， bd …...

2026/5/12 23:52:57 阅读更多 →

4月28日隐喻“鲸鱼开眼”，DeepSeek识图模式灰度上线，迈入图文交互时代！

4月28日，DeepSeek多模态团队研究员推文隐喻“鲸鱼开眼”，次日开启“识图模式”灰度内测，5月初大范围开放。该模式有亮点也有短板，标志其迈入图文交互时代。事件回顾4月28日，DeepSeek多模态团队研究员陈小康在X平台推文…...

2026/5/12 16:00:30 阅读更多 →

AI赋能高能物理：图神经网络与生成式模型在粒子径迹重建与模拟中的应用

1. 项目概述：当AI遇见高能物理的“显微镜”电子离子对撞机（EIC），被誉为探索物质深层结构的下一代“超级显微镜”。它不像我们熟悉的LHC那样让质子对撞，而是让高能电子去轰击质子或重离子，其核心目标是精确“…...

2026/5/11 20:47:18 阅读更多 →

A/B 测试前后的合成控制样本

原文：towardsdatascience.com/synthetic-control-sample-for-before-and-after-a-b-test-683bac36ffc1 简介 A/B 测试非常强大。我喜欢这种实验，因为它让我们能够比较结果，并确定某物是否比另一物表现更好。 A/B 测试有一个特定类型&#x…...

2026/5/12 5:49:54 阅读更多 →