并发环境下,先操作数据库还是先操作缓存?
推荐阅读:幂等问题:8种方案帮你处理重复提交!
在分布式系统中,缓存和数据库同时存在时,假如有写操作的时候,先操作数据库还是先操作缓存呢?先思考一下,可能会存在哪些问题,再往下看。下面我分几种方案阐述。。。
01 缓存维护方案一
假设有一写(线程A)一读(线程B)操作,先操作缓存,在操作数据库。,如下流程图所示:

① 线程A发起一个写操作,第一步del cache
② 线程A第二步写入新数据到DB
③ 线程B发起一个读操作,cache miss,
④ 线程B从DB获取最新数据
⑤ 请求B同时set cache
这样看,没啥问题。我们再看第二个流程图,如下:

① 线程A发起一个写操作,第一步del cache
② 此时线程B发起一个读操作,cache miss
③ 线程B继续读DB,读出来一个老数据
④ 而后老数据入cache
⑤ 线程A写入了最新的数据
OK,酱紫,就有问题了吧,老数据入到缓存了,每次读都是老数据啦,缓存与数据与数据库数据不一致。
02 缓存维护方案二
双写操作,先操作缓存,在操作数据库

① 线程A发起一个写操作,第一步set cache
② 线程A第二步写入新数据到DB
③ 线程B发起一个写操作,set cache,
④ 线程B第二步写入新数据到DB
这样看,也没啥问题。,但是有时候可能事与愿违,我们再看第二个流程图,如下:

① 线程A发起一个写操作,第一步set cache
② 线程B发起一个写操作,第一步setcache
③ 线程B写入数据库到DB
④ 线程A写入数据库到DB
执行完后,缓存保存的是B操作后的数据,数据库是A操作后的数据,缓存和数据库数据不一致。
03 缓存维护方案三
一写(线程A)一读(线程B)操作,先操作数据库,再操作缓存。

① 线程A发起一个写操作,第一步write DB
② 线程A第二步del cache
③ 线程B发起一个读操作,cache miss
④ 线程B从DB获取最新数据
⑤ 线程B同时set cache
这种方案没有显著的并发问题,但是有可能步骤二删除缓存失败,尽管概率比较小,优于方案一和方案二,平常工作中也是使用方案三。
综上比照,我们一般采用方案三,但是有没有完美全处理方案三的弊端的方法呢?
04 缓存维护方案四
这个是方案三的改进方案,都是先操作数据库再操作缓存,我们来看一下流程图:

通过数据库的binlog来异步淘汰key,以mysql为例 可以使用阿里的canal将binlog日志采集发送到MQ队列里面,而后通过ACK机制 确认解决这条升级消息,删除缓存,保证数据缓存一致性。
但是呢还有个问题,假如是主从数据库呢?
05 缓存维护方案五
主从DB问题:由于主从DB同步存在同时延时时间假如删除缓存之后,数据同步到备库之前已经有请求过来时,会从备库中读到脏数据,如何处理呢?处理方案如下流程图:

06 缓存维护总结
综上所述,在分布式系统中,缓存和数据库同时存在时,假如有写操作的时候,先操作数据库,再操作缓存。如下:
① 读取缓存中能否有相关数据
② 假如缓存中有相关数据value,则返回
③ 假如缓存中没有相关数据,则从数据库读取相关数据放入缓存中key->value,再返回
④ 假如有升级数据,则先升级数据,再删除缓存
⑤ 为了保证第四步删除缓存成功,使用binlog异步删除
⑥ 假如是主从数据库,binglog取自于从库
⑦ 假如是一主多从,每个从库都要采集binlog,而后消费端收到最后一台binlog数据才删除缓存
最后:一波读者小福利~
读到这的朋友还可以免费领取一份收集的Java面试资料和Java核心知识体系文档及更多Java进阶知识笔记和视频资料。
欢迎做Java的工程师朋友们加入合作Q群:【 java架构技术交流,578486082 】
群内提供免费的Java架构学习资料(有高可用、高并发、高性能及分布式、Jvm性能调优、Spring源码,MyBatis、Netty、Redis、Kafka、Mysql、Zookeeper、Tomcat、Docker、Dubbo、Nginx等多个知识点的架构资料)
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » 并发环境下,先操作数据库还是先操作缓存?