分布式系统架构：缓存策略与一致性保障的工程实践

张

张建站

2026/6/11 10:02:20

10分钟阅读

分布式系统架构缓存策略与一致性保障的工程实践一、数据库的吞吐瓶颈为什么加缓存不是加个 Redis那么简单当系统 QPS 从千级增长到万级时数据库往往率先成为瓶颈。缓存是缓解数据库压力的标准手段但加个 Redis背后隐藏着一系列工程决策缓存什么数据、用什么缓存模式、如何保证缓存与数据库的一致性、如何处理缓存穿透和雪崩。一个不当的缓存策略不仅无法提升性能还可能引入数据不一致、内存浪费和级联故障等更严重的问题。二、缓存模式与一致性模型常见的缓存模式有四种Cache-Aside旁路缓存、Read-Through/Write-Through读写穿透、Write-Behind异步写回和 Refresh-Ahead预刷新。不同模式在一致性、延迟和写入性能之间做出不同的权衡。graph TD A[缓存模式选择] -- B{读写比例} B --|读多写少| C[Cache-Asidebr/最简单一致性可控] B --|读写均衡| D[Write-Throughbr/读写均穿透缓存] B --|写多读少| E[Write-Behindbr/异步写回高吞吐] F[一致性要求] -- G{强一致还是最终一致} G --|强一致| H[双写分布式锁br/性能代价高] G --|最终一致| I[延迟双删消息队列br/可接受的延迟窗口] style C fill:#e1f5fe style D fill:#c8e6c9 style E fill:#fff3e0 style H fill:#ffcdd2 style I fill:#e8f5e9Cache-Aside 是最常用的模式读请求先查缓存命中则直接返回未命中则查数据库并回填缓存写请求先更新数据库再删除缓存。这种模式的一致性问题集中在更新数据库与删除缓存之间的时间窗口——并发请求可能读到旧数据并回填缓存导致缓存与数据库不一致。三、缓存一致性保障的工程实现3.1 延迟双删策略import asyncio import time from typing import Any, Optional, Callable import json class CacheManager: 缓存管理器实现延迟双删策略保障最终一致性 def __init__( self, redis_client, db_query_fn: Callable, delay_seconds: float 0.5, key_prefix: str cache, default_ttl: int 3600, ): self.redis redis_client self.db_query_fn db_query_fn self.delay_seconds delay_seconds self.key_prefix key_prefix self.default_ttl default_ttl def _make_key(self, key: str) - str: return f{self.key_prefix}:{key} async def get(self, key: str) - Optional[Any]: 读取数据缓存优先未命中则查库回填 cache_key self._make_key(key) # 1. 查询缓存 cached await self.redis.get(cache_key) if cached is not None: return json.loads(cached) # 2. 缓存未命中查询数据库 data await self.db_query_fn(key) if data is not None: # 回填缓存设置 TTL 防止永不过期 await self.redis.setex( cache_key, self.default_ttl, json.dumps(data, ensure_asciiFalse) ) return data async def write_with_double_delete(self, key: str, write_fn: Callable) - Any: 延迟双删写入策略 1. 先删除缓存防止旧数据被读到 2. 更新数据库 3. 延迟后再删一次缓存防止并发读回填了旧数据设计考量步骤 1 和步骤 3 之间的延迟窗口内并发读请求可能从数据库读到旧值并回填缓存。步骤 3 的延迟删除确保即使发生回填旧缓存也会被清除。 cache_key self._make_key(key) # 第一次删除缓存 await self.redis.delete(cache_key) # 更新数据库 result await write_fn() # 延迟后第二次删除缓存 async def delayed_delete(): await asyncio.sleep(self.delay_seconds) await self.redis.delete(cache_key) asyncio.create_task(delayed_delete()) return result3.2 基于 Canal 的数据库变更订阅import json from typing import Callable, Dict class CanalCacheInvalidator: 基于 CanalMySQL Binlog 订阅的缓存失效器监听数据库变更事件精准失效相关缓存设计考量延迟双删依赖固定延迟无法覆盖所有并发场景。 Canal 方案通过监听数据库实际变更实现更可靠的缓存失效。 def __init__(self, redis_client, key_prefix: str cache): self.redis redis_client self.key_prefix key_prefix # 表名 → 缓存 Key 生成函数的映射 self._table_handlers: Dict[str, Callable] {} def register_table_handler( self, table: str, key_generator: Callable[[dict], list] ): 注册表变更处理器 key_generator 接收变更行数据返回需要失效的缓存 Key 列表 self._table_handlers[table] key_generator async def handle_binlog_event(self, event: dict): 处理 Binlog 变更事件解析表名与行数据失效对应缓存 table event.get(table) action event.get(action) # INSERT / UPDATE / DELETE row_data event.get(data, {}) handler self._table_handlers.get(table) if handler is None: return # 生成需要失效的缓存 Key cache_keys handler(row_data) # 批量删除缓存 if cache_keys: full_keys [f{self.key_prefix}:{k} for k in cache_keys] await self.redis.delete(*full_keys) # 使用示例 async def setup_invalidator(redis_client): invalidator CanalCacheInvalidator(redis_client) # 注册用户表的缓存失效规则 invalidator.register_table_handler( users, lambda row: [ fuser:{row[id]}, # 用户详情缓存 fuser:email:{row[email]}, # 邮箱查询缓存 ] ) # 注册订单表的缓存失效规则 invalidator.register_table_handler( orders, lambda row: [ forder:{row[id]}, # 订单详情缓存 fuser:orders:{row[user_id]}, # 用户订单列表缓存 ] ) return invalidator3.3 缓存穿透与雪崩防护import hashlib import time class CacheProtection: 缓存防护穿透防护布隆过滤器与雪崩防护随机 TTL def __init__(self, redis_client): self.redis redis_client async def prevent_penetration( self, key: str, db_query_fn: Callable, null_ttl: int 60, ) - Optional[Any]: 防止缓存穿透对查询结果为空的 Key 也缓存设置短 TTL 避免大量请求穿透到数据库设计考量空值缓存不能设太长 TTL否则数据写入后缓存仍返回空值导致数据不一致 cache_key fcache:{key} cached await self.redis.get(cache_key) if cached is not None: # 区分有数据的缓存和空值标记 if cached __NULL__: return None return json.loads(cached) # 查询数据库 data await db_query_fn(key) if data is not None: await self.redis.setex(cache_key, 3600, json.dumps(data, ensure_asciiFalse)) else: # 空值标记短 TTL防止穿透 await self.redis.setex(cache_key, null_ttl, __NULL__) return data async def set_with_jitter(self, key: str, value: str, base_ttl: int, jitter_range: int 300): 防止缓存雪崩在基础 TTL 上添加随机偏移避免大量 Key 同时过期导致瞬时数据库压力激增设计考量jitter_range 应为基础 TTL 的 5%-10% 过大导致缓存命中率下降过小无法有效分散过期时间 import random ttl base_ttl random.randint(-jitter_range, jitter_range) await self.redis.setex(key, max(ttl, 60), value)四、缓存架构的边界与权衡缓存一致性的根本矛盾在于数据库与缓存是两个独立的存储系统无法通过单次操作原子地更新两者。延迟双删在大多数场景下足够可靠但在极端并发下仍可能出现短暂不一致。Canal 方案通过监听 Binlog 实现更精准的失效但引入了 Canal 组件的运维成本和 Binlog 解析的延迟通常 10-100ms。在缓存容量规划上Redis 内存是有限资源。缓存所有数据不现实必须制定淘汰策略。LRU最近最少使用是默认策略但业务热点数据可能被偶发的批量查询挤出缓存。LFU最不经常使用更适合稳定热点的场景但对突发热点响应较慢。缓存不是万能药。当缓存命中率低于 80% 时缓存的收益可能不足以覆盖其引入的复杂度。命中率低的原因通常是缓存 Key 设计不合理、TTL 过短、数据访问模式过于分散。在引入缓存前应先通过数据库慢查询日志和访问模式分析确认缓存的预期收益。五、总结缓存策略的核心是在一致性、延迟和吞吐之间找到平衡点。Cache-Aside 模式配合延迟双删是大多数场景的务实选择对一致性要求更高的场景可引入 Canal Binlog 订阅实现精准失效穿透防护通过空值缓存和布隆过滤器避免无效查询穿透雪崩防护通过随机 TTL 分散过期时间。缓存架构的落地必须以命中率为北极星指标——低于 80% 的命中率意味着缓存策略需要重新审视。

如何识别图片文字转化为文本

当你的付费课程笔记、会议白板或书本重点截图散落在相册里，看着密密麻麻的文字却不知如何整理时，这篇教程就是为你准备的。我们将直面“图片文字转文本”这个看似简单却处处是坑的任务，手把手带你从零掌握最高效的数字化路径，让你…...

2026/6/11 9:55:12 阅读更多 →

青龙面板资产推送进阶：如何自定义WxPusher通知内容与多账号管理？

青龙面板资产推送进阶：如何自定义WxPusher通知内容与多账号管理？在数字化资产管理领域，青龙面板配合WxPusher的推送能力已经成为许多技术爱好者的标配方案。但当你已经跨过基础配置门槛，是否开始思考：如何让推送内容更…...

2026/6/11 9:44:54 阅读更多 →

轻量级网页数据监控脚本：自动抓取价格/余票/股价并邮件告警

本文还有配套的精品资源，点击获取简介：这个Python工具能定时访问网页，不打开浏览器、不依赖JavaScript渲染，直接解析HTML源码。用正则表达式精准定位页面里的关键数字——比如某款商品的实时售价、某趟列车的剩余车票数、某只…...

2026/6/11 9:40:53 阅读更多 →

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…...

2026/6/10 4:21:44 阅读更多 →

2026实测盘点｜适合国内高校生的AI写作平台，降重润色哪家强？

2026年毕业季，学术审查全面加码。教育部明确要求毕业论文AIGC率不得超过30%，985/211院校更是将红线压到了20%以内，硕士论文甚至卡到15%。与此同时，知网上线AIGC 3.0系统，可实现段落级内容溯源；维普引入语义…...

2026/6/10 19:45:23 阅读更多 →

JewelCraft：Blender珠宝设计的终极免费解决方案

JewelCraft：Blender珠宝设计的终极免费解决方案【免费下载链接】jewelcraft Blender add-on for jewelry design 项目地址: https://gitcode.com/gh_mirrors/je/jewelcraft JewelCraft是一款专为珠宝设计师和3D艺术家打造的Blender插件，提供完整…...

2026/6/10 4:21:44 阅读更多 →