必看的数据库使用规范

用户头像
Simon
关注
发布于: 2020 年 08 月 21 日
必看的数据库使用规范

导读:



关于MySQL数据库规范,相信大家多少看过一些文档。本篇文章给大家详细分类总结了数据库相关规范,从库表命名设计规范讲起,到索引设计规范,后面又给出SQL编写方面的建议。相信这些规范适用于大多数公司,也希望大家都能按照规范来使用我们的数据库,这样我们的数据库才能发挥出更高的性能。



关于库:



  1. 【强制】库的名称必须控制在32个字符以内,英文一律小写。

  2. 【强制】库的名称格式:业务系统名称_子系统名。

  3. 【强制】库名只能使用英文字母,数字,下划线,并以英文字母开头。

  4. 【强制】创建数据库时必须显式指定字符集,并且字符集只能是utf8或者utf8mb4。创建数据库SQL举例:Create database db1 default character set utf8;

  5. 【建议】临时库、表名以tmp_ 为前缀,并以日期为后缀,备份库、表以 bak_ 为前缀,并以日期为后缀。



关于表



  1. 【强制】表和列的名称必须控制在32个字符以内,表名只能使用字母、数字和下划线,一律小写。

  2. 【强制】表名要求模块名强相关,同一模块使用的表名尽量使用统一前缀。

  3. 【强制】创建表时必须显式指定字符集为utf8或utf8mb4。

  4. 【强制】列名尽量不用关键字(如type,order等)。

  5. 【强制】创建表时必须显式指定表存储引擎类型,如无特殊需求,一律为InnoDB。

  6. 【强制】建表必须有comment。

  7. 【强制】对于超过100W行的大表进行alter table,必须经过DBA审核,并在业务低峰期执行,多个alter需整合在一起。

因为alter table会产生表锁,期间阻塞对于该表的所有写入,对于业务可能会产生极大影响。

  1. 【建议】建表时关于主键:表必须有主键

(1)强制要求主键为id,类型为int或bigint,且为auto_increment 建议使用unsigned无符号型。



(2)标识表里每一行主体的字段不要设为主键,建议设为其他字段如userid,orderid等,并建立unique key索引。

因为如果设为主键且主键值为随机插入,则会导致innodb内部page分裂和大量随机I/O,性能下降。

  1. 【建议】核心表(如用户表)必须有行数据的创建时间字段create_time和最后更新时间字段update_time,便于查问题。

  2. 【建议】表中所有字段尽量都是NOT NULL属性,业务可以根据需要定义DEFAULT值。

因为使用NULL值会存在每一行都会占用额外存储空间、数据迁移容易出错、聚合函数计算结果偏差等问题。

  1. 【建议】中间表用于保留中间结果集,名称必须以tmp_ 开头。备份表用于备份或抓取源表快照,名称必须以bak_开头。中间表和备份表定期清理。

  2. 【示范】一个较为规范的建表语句:



CREATE TABLE user_info (
`id` int unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
`user_id` bigint(11) NOT NULL COMMENT '用户id',
`username` varchar(45) NOT NULL COMMENT '真实姓名',
`email` varchar(30) NOT NULL COMMENT '用户邮箱',
`nickname` varchar(45) NOT NULL COMMENT '昵称',
`birthday` date NOT NULL COMMENT '生日',
`sex` tinyint(4) DEFAULT '0' COMMENT '性别',
`short_introduce` varchar(150) DEFAULT NULL COMMENT '一句话介绍自己,最多50个汉字',
`user_resume` varchar(300) NOT NULL COMMENT '用户提交的简历存放地址',
`user_register_ip` int NOT NULL COMMENT '用户注册时的源ip',
`create_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
`update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改时间',
`user_review_status` tinyint NOT NULL COMMENT '用户资料审核状态,1为通过,2为审核中,3为未通过,4为还未提交审核',
PRIMARY KEY (`id`),
UNIQUE KEY `uniq_user_id` (`user_id`),
KEY `idx_username`(`username`),
KEY `idx_create_time_status`(`create_time`,`user_review_status`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='网站用户基本信息'



关于索引



  1. 【强制】InnoDB表必须主键为id int/bigint auto_increment,且主键值禁止被更新。

  2. 【强制】InnoDB和MyISAM存储引擎表,索引类型必须为BTREE。

  3. 【建议】主键的名称以 pk_ 开头,唯一键以 uniq_uk_ 开头,普通索引以 idx_ 开头,一律使用小写格式,以字段的名称或缩写作为后缀。

  4. 【建议】单个表上的索引个数不能超过8个。

  5. 【建议】在建立索引时,多考虑建立联合索引,并把区分度最高的字段放在最前面。如列userid的区分度可由select count(distinct userid)计算出来。

  6. 【建议】在多表join的SQL里,保证被驱动表的连接列上有索引,这样join执行效率最高。

  7. 【建议】建表或加索引时,保证表里互相不存在冗余索引。

对于MySQL来说,如果表里已经存在key(a,b),则key(a)为冗余索引,需要删除。



SQL编写



  1. 【强制】程序端SELECT语句必须指定具体字段名称,禁止写成 *。

  2. 【强制】程序端insert语句指定具体字段名称,不要写成insert into t1 values(…)。

  3. 【强制】除静态表或小表(100行以内),DML语句必须有where条件,且使用索引查找。

  4. 【强制】where条件里等号左右字段类型必须一致,否则无法利用索引。

  5. 【强制】WHERE 子句中禁止只使用全模糊的LIKE条件进行查找,必须有其他等值或范围查询条件,否则无法利用索引。

  6. 【强制】索引列不要使用函数或表达式,否则无法利用索引。如where length(name)='Admin'或where user_id+2=10023。

  7. 【建议】insert into…values(XX),(XX),(XX).. 这里XX的值不要超过5000个。

值过多虽然上线很很快,但会引起主从同步延迟。

  1. 【建议】SELECT语句不要使用UNION,推荐使用UNION ALL,并且UNION子句个数限制在5个以内。

因为union all不需要去重,节省数据库资源,提高性能。

  1. 【强制】禁止跨db的join语句。

  2. 【建议】不建议使用子查询,建议将子查询SQL拆开结合程序多次查询,或使用join来代替子查询。

  3. 【建议】线上环境,多表join不要超过5个表。

  4. 【建议】在多表join中,尽量选取结果集较小的表作为驱动表,来join其他表。

  5. 【建议】批量操作数据时,需要控制事务处理间隔时间,进行必要的sleep。

  6. 建议】事务里包含SQL不超过5个

因为过长的事务会导致锁数据较久,MySQL内部缓存、连接消耗过多等问题。

  1. 【建议】事务里更新语句尽量基于主键或unique key,如update … where id=XX;

否则会产生间隙锁,内部扩大锁定范围,导致系统性能下降,产生死锁。

  1. 【建议】减少使用order by,和业务沟通能不排序就不排序,或将排序放到程序端去做。Order by、group by、distinct这些语句较为耗费CPU,数据库的CPU资源是极其宝贵的。

  2. 【建议】order by、group by、distinct这些SQL尽量利用索引直接检索出排序好的数据。如where a=1 order by b可以利用key(a,b)。

  3. 【建议】包含了order by、group by、distinct这些查询的语句,where条件过滤出来的结果集请保持在1000行以内,否则SQL会很慢。



发布于: 2020 年 08 月 21 日 阅读数: 49
用户头像

Simon

关注

MySQL技术学习者 2018.06.08 加入

公众号『MySQL技术』作者

评论

发布
暂无评论
必看的数据库使用规范