写点什么

深入理解 MYSQL 之缓存

作者:C++后台开发
  • 2022 年 9 月 20 日
    湖南
  • 本文字数:2242 字

    阅读完需:约 7 分钟

深入理解MYSQL之缓存

在讲缓存之前先了解一下,什么是 MYSQL 的主从复制和读写分离。

主从复制

 master 是主数据库,stave 从数据库

  (1)DML 操作引起主数据库数据变更,产生 binlog 文件(二进制日志,在事务提交后产生),通过 io-thread 写入 binlog;

  (2)从数据库请求读取 binlog,开启 io-thread 线程读取主数据库发送过来的 binlog,并写入 relaylog(中继日志);

  (3)从数据库通过 SQL-thread 读取 relaylog,进行回放(就是在主数据执行的 DML 操作在从数据库执行一遍),这样就能保持从数据库与主数据库一致。

读写分离

​ 应用层写操作在主数据库,读操作在从数据库,这种读写分离可高效解决读性能,由于主数据库同步到从数据库需要一点的时间,所以从数据库读取到的数据不一定是最新的数据,会有一定的延迟,看具体的业务要求可否满足。最终一致性,写主数据库,读从数据库;而强一致性,写主数据库,对于读,根据业务需求,对数据进行划分,那些数据对一致性要求高的,读主数据库,那些数据对一致性要求不高的,读从数据库。

缓存方案

  使用的前提是读多写少,单个节点能支撑项目数据量;MySQL 有缓冲层,它的作用是用来缓存热点数据,这些数据包括数据文件、索引文件等;MySQL 缓冲层是从自身出发,跟具体的业务无关;MySQL 数据主要存储在磁盘当中,适合大量重要数据的存储。

  缓存数据库可以使用 redis、memcached;它所有的数据都存储在内存当中,当然也可以将内存当中的数据持久化到磁盘中;内存的访问速度是磁盘访问速度的 10 万倍,所以可以将热点数据在缓存数据库中备份,将热点读操作转移到缓存数据库。

同步问题

  没有缓冲层之前,我们对数据库的读写都是基于 MySQL,所以不存在同步问题;引入缓冲层后,我们需要分别操作 MySQL 和缓存数据库,那么这个时候数据可能存在几个状态:

  (1)MySQL 有,缓存无;

  (2)MySQL 无,缓存有;

  (3)都有,但是数据不一致;

  (4)都有,数据一致;

  (5)都没有。

  4,5 显然没有问题,我们获取数据的主要依据是 MySQL,所以在保证 MySQL 数据正确下,只需将 MySQL 的数据正确同步到缓存数据库就可以了;对于 2,缓存有 MySQL 无,可以认为这是脏数据,MySQL 和缓存都有,但不一致,这两个问题,在同步策略中需要避免。

C/C++Linux服务器开发高级架构师/C++后台开发架构师​免费学习地址

【文章福利】另外小编还整理了一些 C/C++后台开发教学视频,相关面试题,后台学习路线图免费分享,需要的可以自行添加:Q群:720209036 点击加入~ 群文件共享,详情看以下视频


解决数据同步问题

  以下分别对强一致性和最终一致性解决同步问题。

(1)强一致性

​ a. 同步是否成功的依据来源于 mysql 是否同步到 redis,即使没有同步成功,也没有关系;

    b. 写流程:先删除缓存,再写 mysql,后面同步数据交由 go-mysql-transfer;

    c. 先删除缓存,为了避免其他服务读取旧的数据,也是告知系统这个数据已经不是最新,建议从 mysql 获取;

    d. 强一致性只试用于单数据中心的模型下;

    e. 多数据中心模型,不管先操作 redis 还操作 mysql 都会引起分布式异常问题的产生,此时可以使用分布式锁解决,但是得不偿失,可以将多数据中心转为单数据中心;或者强一致性需求读写都走 mysql,其他低一致性需求走最终一致性。

    为什么要删除?

      对于同一个服务器而言,写 MySQL 前如果不删除 redis 中对应的 key,其他的访问可能会读取到老数据,导致数据不一致。

(2)最终一致性

​  读写分离,主库将数据同步到从库,是需要一定时间,那么在同步期间,主从之间数据有差异,有两种解决方案:

    a. 直接写 mysql,等待 mysql 同步数据到 redis;

    b. 先写 redis,设置 key 的过期时间为 200ms,等待 mysql 写回 redis,覆盖 key,设置更长的过期时间;200ms 默认的是写 mysql 到 mysql 同步到 redis 时长,这个需要根据实际环境进行设置。

异常情况

  (1)缓存穿透

    假设某个数据 redis 不存在,mysql 也不存在,如果一直尝试读,数据最终压力依然堆积在 MySQL,可能造成 MySQL 不堪负重而崩溃。

    解决方法:

      a.发现 MySQL 不存在,将 redis 中访问的这个 key 设置为<key,nil>,并设置过期时间,下次访问该 key 的时候,不再访问 MySQL,不过会容易造成 redis 缓存很多无效数据

      b.布隆过滤器(存在限制是不持支删除操作),将 MySQL 当中已经存在的 key,写入布隆过滤器,访问不存在的可直接 pass 掉。

  (2)缓存击穿

    某些数据 redis 没有,但是 mysql 有;此时大量这类数据的并发请求,同样造成 mysql 压力过大。

    解决:

      a. 加锁,请求数据时获取锁,如果获取成功,则操作(先读 redis,不存在,读 mysql,写 redis,释放锁);获取失败,则休眠一段时间(200ms)再去获取,获取成功,待操作完后释放锁;

      b. 将很热的 key,设置永不过期。

  (3)缓存雪崩

    表示一段时间内,缓存集中失效(redis 无,mysql 有),导致请求全部走 mysql,可能搞垮数据库,整个服务失效。

    解决:

      a. 如果因为缓存数据库宕机,造成所有数据涌向 mysql;采用高可用的集群方案,如哨兵模式、cluster 模式;

      b. 如果因为设置了相同的过期时间,造成缓存集中失效;设置随机过期时间或者其他机制错开失效;

      c. 如果因为系统重启的时候,造成缓存数据库失效;重启时间短,redis 开启持久化(过期时间也会持久化)就行了;如果重启时间长,则提前将热数据导入 redis 当中。


原文地址:MYSQL之缓存 - MrJuJu - 博客园

用户头像

C/C++后台开发技术交流qun:720209036 2022.05.06 加入

还未添加个人简介

评论

发布
暂无评论
深入理解MYSQL之缓存_MySQL_C++后台开发_InfoQ写作社区