MySQL 基础知识 + 索引相关
1.0 基础知识
一张数据表中具有百万级的数据时,如何精确且快速的拿出其中某一条或多条记录成为了人们思考的问题。
InnoDB 存储引擎的出现让这个问题得到了很好的解决,InnoDB 存储引擎是以索引来进行数据的组织,而索引在 MySQL 中也被称之为键,因此 UNIQUE KEY,PRIMARY KEY 约束字段会作为索引字段。
当没有明确指出 PRIMAY KEY 时,InnoDB 存储引擎会自动的创建一个 6 字节的隐藏主键用于组织数据,但是由于该主键是隐藏的所以对查询没有任何帮助。
索引相当于一本大字典的目录,有了目录来找想要的内容就快很多,否则就只能进行一页一页的遍历查询
2.0 查找过程
索引的查找过程是依照 B+树算法进行查找的,而每一张数据表都会有一个且只能有一个与之对应的树
只有最下面一层节点中存储一整行记录
第二层及第一层中黄色部分为指针
如图所示,如果要查找数据项 29,那么首先会把磁盘块 1 由磁盘加载到内存,此时发生一次 IO,在内存中用二分查找确定 29 在 17 和 35 之间,锁定磁盘块 1 的 P2 指针,内存时间因为非常短(相比磁盘的 IO)可以忽略不计,通过磁盘块 1 的 P2 指针的磁盘地址把磁盘块 3 由磁盘加载到内存,发生第二次 IO,29 在 26 和 30 之间,锁定磁盘块 3 的 P2 指针,通过指针加载磁盘块 8 到内存,发生第三次 IO,同时内存中做二分查找找到 29,结束查询,总计三次 IO。真实的情况是,3 层的 B+树可以表示上百万的数据,如果上百万的数据查找只需要三次 IO,性能提高将是巨大的,如果没有索引,每个数据项都要发生一次 IO,那么总共需要百万次的 IO,显然成本非常非常高。
3.0 索引分类
索引分为聚集索引与辅助索引
3.1 聚集索引
聚集索引是会直接按照 B+树进行查询,由于 B+树的底层叶子节点是一整行记录,所以聚集索引能够十分快速的拿到一整行记录。
值得注意的是,一张数据表中只能有一个聚集索引。
3.2 辅助索引
辅助索引的树最底层的叶子节点并不会存储一整行记录,而是只存储单列索引的数据,并且还存储了聚集索引的信息。
通过辅助索引进行查询时,先拿到自身索引字段的数据,再通过聚集索引拿到整行记录,也就是说辅助索引拿一整行记录而言需要最少两次查询。
而一张数据表中可以有多个辅助索引。
4.0 创建索引
4.1 索引类型
索引名类型 INDEX(field)普通索引,只加速查找,无约束条件 PRIMARY KEY(field)主键索引,加速查找,非空且唯一约束 UNIQUE(field)唯一索引,加速查找,唯一约束 INDEX(field1,field2)联合普通索引 PRIMARY KEY(field1,field2)联合主键索引 UNIQUE(field1,field2)联合唯一索引 FULLTEXT(field)全文索引 SPATIAL(field)空间索引
使用场景
4.2 语法介绍
索引应当再建立表时就进行创建,如果表中已有大量数据,再进行创建索引会花费大量的时间。
4.3 功能测试
在无索引的情况下,查找 id 为 567891 的这条记录,耗时 0.03s
接下来为 id 字段建立主键索引后再进行查找,耗时为 0.00s
小编整理了一份 Java 基础视频、技术文档、电子书、面试题、简历模板等福利分享给大家。
评论