一次大规模 PDF 导出系统的工程复盘

张

张建站

2026/6/24 13:42:44

10分钟阅读

——从“能跑”到“稳定可控”的完整决策过程背景业务中存在一类历史记录数据（若干字段 + 图片），需要支持批量导出为 PDF，用于归档和离线查看。单页约包含 3 条记录，每条记录包含图片资源。在极端情况下，导出任务可能涉及：数千页内容上万张图片国内 / 海外多云部署弱网与不稳定网络环境这类任务不属于实时请求链路，但对系统稳定性要求极高。一、问题定义：这不是“导出”，而是“批处理系统”在需求分析阶段，我们没有将其简单视为“生成 PDF”，而是明确了它的工程属性：✅ 高 IO 消耗（大量图片下载、文件读写）✅ 高 CPU 消耗（无头浏览器渲染、HTML → PDF）✅ 高内存消耗（图片解码、页面上下文）✅ 异步、长时间任务✅ 失败不可影响主业务因此，首要目标不是“速度最快”，而是：在极端数据量和不稳定环境下，保证导出成功率和系统隔离性。二、架构选择：为什么使用函数计算（Serverless）我们评估了三种方案：前端直接渲染并导出 PDF（否决）大数据量下浏览器内存占用极高页面卡死甚至崩溃严重影响用户体验结论：重计算任务不应放在客户端执行。放入核心后端服务（风险较高）属于资源消耗不可控的任务在并发或异常情况下，可能拖垮核心服务导出功能并非主业务链路结论：不应与核心服务共享资源池。使用函数计算进行任务隔离（最终选择）独立计算环境异步执行资源可配置即使失败也不影响主业务结论：该任务更适合放入 Serverless / 外部计算资源中。三、初始方案设计整体流程如下：前端创建导出任务将结构化数据打包为 JSON（图片仅传 URL）通过消息机制触发函数计算Node.js 函数计算启动无头浏览

Vibe Coding 起源和介绍

Vibe Coding（氛围编程 / 感觉编程）是 2025 年初由Andrej Karpathy（OpenAI 联合创始人、特斯拉前 AI 负责人）提出的 AI 驱动软件开发范式，核心是用自然语言描述意图，让 AI 生成 / 迭代代码，人类专…...

2026/6/24 14:29:02 阅读更多 →

PyTorch 2.8 驱动运维自动化：利用AI模型预测服务器GPU故障

PyTorch 2.8 驱动运维自动化：利用AI模型预测服务器GPU故障 1. 引言：当AI遇见运维 "凌晨3点，GPU服务器突然宕机"——这样的场景对运维团队来说简直是噩梦。传统运维模式下，我们往往被动应对故障，而现代AI技…...

2026/6/24 14:22:11 阅读更多 →

AI上下文模板：构建团队专属知识库，统一AI编程助手规范

1. 项目概述：为什么我们需要一个“AI上下文模板”？如果你和我一样，最近几个月深度使用了 Claude Code 或 Cursor AI 这类“懂代码”的AI助手，那你一定遇到过这个痛点：每次开启一个新项目，或者换一台机器&am…...

2026/6/21 5:30:48 阅读更多 →

如何快速配置ExplorerPatcher：面向Windows用户的完整界面定制指南

如何快速配置ExplorerPatcher：面向Windows用户的完整界面定制指南【免费下载链接】ExplorerPatcher This project aims to enhance the working environment on Windows 项目地址: https://gitcode.com/GitHub_Trending/ex/ExplorerPatcher 还在为Windows 1…...

2026/6/23 11:48:29 阅读更多 →