写点什么

项目上线后我是如何通过慢查询和索引让系统快起来的

  • 2023-02-20
    湖南
  • 本文字数:2339 字

    阅读完需:约 8 分钟

最近对 mysql 的操作比较多一些,主要是项目上线以后,难免会有一些数据上的问题。开始的时候还主要由后端来处理,后面数据问题确实比较多,于是我就找后端要来服务器的账号密码,连上数据库顺便来看看数据的问题。


周五使用人数达到了高峰,总共有 5300 人在使用,今天截图的时候是周六人数略有减少。


这是三个表数据比较大的表,目前大致运行两周的时间就已经很大了。


这是数据量最多的一张表,大致已经 410W 条记录了。


算是一个小小的系统,不算大,但是从目前数据量的增加来看,慢慢的数据量可能会越来越大。

一、mysql 索引

最开始项目刚上线的时候,因为没有数据,所以根本没什么感觉,突然某一天,就感觉到接口的响应时间明显的变慢了。但其实后端并没有什么线上的经验,所以我借机就要来了服务器的账号密码。基本上除了主键以外,没有加任何的索引。打到数据库上的查询就实打实的有一些慢了,(虽然这里使用了一主四从),四个从库相当于都是用来做查询使用的,但是在没有索引的情况下,真的有点慢了。我跟后端稍作沟通,我就准备直接在正式环境添加数据库表的索引了。


这是平常小程序里接口的返回时间记录。而且有时候根据访问人数的不同,偶尔有时候会到三秒到四秒。

二、打开慢查询记录开关

那么能否通过专业的工具去查看呢?首先我做的第一件事情便是,查看一下 mysql 的慢查询是否有打开,好家伙,还不错,竟然打开了。如果没开启可以开启一下:

// 查看慢查询日志是否开启  on为开启  off为关闭 默认是关闭的show variables like 'slow_query_log';
// 设置是否开启慢查询日期记录set global slow_query_log = on; #开启set global slow_query_log = off; #关闭
// 查看慢查询的阈值(默认是10秒)show variables like 'long_query_time';
// 如果想修改慢查询的阈值
// 阈值设置为1秒set global long_query_time = 1;
// 查看慢查询日志文件路径show variables like 'slow_query_log_file';
复制代码

如果慢查询记录 log 没有打开,可以参考一下这篇文章:juejin.cn/post/716761…

四、通过 mysqldumpslow 查询慢查询 sql

下面是常用的几个查询慢 SQL 的脚本语句

// 得到返回记录集最多的10条SQL:mysqldumpslow -s r -t  10 /var/lib/mysql/slow.log
// 得到访问次数最多的10条SQL:mysqldumpslow -s r -t 10 /data/mysql/slow.log
// 得到按照时间排序的前10条里面含有左连接的SQL:mysqldumpslow -s t -t 100 -g "left join" /var/lib/mysql/slow.log
// 也支持管道符命令mysqldumpslow -s t -t 10 -g "left join" /var/lib/mysql/slow.log | more //分页显示
复制代码

执行后结果如下所示,一目了然


可以查看到第一个 sql 平均耗时 2.94s,这个 sql 不论在哪里使用都会感觉慢了。所以这个时候查看 sql 以后,可以使用 explain + sql 在 mysql 客户端执行,查看执行计划


可以查看返回结果,我平常观察最多的几个字段便是 type、 rows、Extra、等字段。

如果你想详细了解 explain 的执行计划,你可以访问如下链接来重点阅读: juejin.cn/post/716359…

五、直接添加索引

我简单可以总结为如下:

  1. join 后看表关联的字段

  2. where 后看查询条件的字段

  3. group by order by 后的 分组条件和排序条件


在有条件的时候,上述地方能加索引就加索引,但是通常一张表添加五个索引就算比较多的,因为如果一张表索引过多在其他地方,比如存储、添加、删除的时候都会重新整理索引,成本消耗会很大。


目前来说这种简单粗暴的方式,在几百万数据的量级完全解决了我的问题,这里展示了我随便找的一张表,里面添加了四个索引,这里完全可以用四个字段的普通索引即可,我这里当时为了验证联合索引或者叫复合索引就没改了,目前来看效果还是嘎嘎的香,随着数据量的增加我猜测索引会有调整。

六、重置慢查询日志

假如我们优化完毕了,正式环境重新部署了,我们想查看一下效果,比如想去查询一下慢查询的日志记录,但是之前的日志记录还在,这个时候我们应该怎么办呢?

// 通过rm直接删除慢查询日志记录文件rm slow.log
// 然后记得要重置慢查询才会开启继续登录
// 在 mysql所在的linux服务器上执行mysqladmin -uroot -p flush-logs slow
//或者在mysql数据库中执行mysql> FLUSH LOGS;
复制代码

重置后可查看 slow.log 是否重新生成。

七、注意事项

  • 尽量禁止使用 select * 进行查询:减少 IO 和传递压力等

  • 查询条件的类型尽量与数据库里的类型一致:不一致可能导致索引失效

  • group by 后如果不想排序 可以在后面添加 order by null

  • 查询计划中尽量避免全表扫描

  • 每张表都要设置主键,因为不设置 mysql 会自动帮我们设置

  • 主键最好不要用 GUID,尽量自增 ID(GUID 插入时时无序的)

  • 明确只返回一条记录的 sql 可以加上 limit 1

  • 联合索引(复合索引)查询时要注意查询字段的顺序

  • 如果可以尽量给字段设置默认值,不要为 null 空值,null 在一定程度上会造成索引失效

  • like 模糊查询尽量不要以 % 开头,因为会造成索引失效

  • 一个 sql 关联的表不要过多(通常最多三到五个)

  • 多表查询时一定先以小表查询,再来查询大表,也就是小表驱动大表

  • 尽量少用 or 会造成索引失效,有些时候可以使用 union all 替换

  • 当然还有其他的,暂时在项目使用就这么多

八、总结

一种情况时找到具体接口中使用的 sql,如果很慢进行优化 sql 或者添加索引,另外一种时通过 mysql 工具查找到记录的慢查询 sql,可以直接根据表结构进行添加索引,如果很复杂,而且简单的增加索引无法提速,可能要根据具体业务进行分析调整再添加索引。总之索引的使用在大部分情况下是非常有效的。 通过 explain 查看 sql 执行计划,进行优化索引和表设计,因为在某些情况合理的表结构默认值设置、或者表关联字段设置,都能有效的避免全表扫描。 总之不要怂,加错了索引,大不了花点时间删除就好了。


作者:那个曾经的少年回来了

链接:https://juejin.cn/post/7173308940036341791

来源:稀土掘金

用户头像

还未添加个人签名 2021-07-28 加入

公众号:该用户快成仙了

评论

发布
暂无评论
项目上线后我是如何通过慢查询和索引让系统快起来的_MySQL_做梦都在改BUG_InfoQ写作社区