隐秘的 MySQL 类型转换

用户头像
架构精进之路
关注
发布于: 2020 年 09 月 02 日
隐秘的MySQL类型转换

近期工作中同事遇到的一个真实问题,稍作整理后分享给大家~

1、问题开篇

一张用户表,其中phone 添加了普通索引:

CREATE TABLE users (
id bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键ID',
name varchar(32) COLLATE utf8mb4_unicode_ci NOT NULL DEFAULT '' COMMENT '名称',
phone varchar(16) COLLATE utf8mb4_unicode_ci NOT NULL DEFAULT '' COMMENT '手机',
created_at timestamp NOT NULL DEFAULT '1970-01-01 16:00:00' COMMENT '创建时间',
updated_at timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',
PRIMARY KEY (id),
KEY idx_phone (phone)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci COMMENT='用户表';



分别执行以下SQL:

1、字符串类型查询

EXPLAIN SELECT * FROM users WHERE phone = '2';

执行计划如下:

2、数值型查询

EXPLAIN SELECT * FROM users WHERE phone = 2;

执行计划如下:

发现问题:

当索引字段 `phone` 为字符串类型时,字符串查询时候使用了索引`idx_phone`,而数值类型查询时候竟无法使用索引`idx_phone`。

2、问题引申

假如索引字段为整型的话,那用字符串查询时会不会走索引呢?

实践出真知,我们来验证一下。

同样如上表,修改字段 `phone` 类型由 varchar 变更为 bigint:

ALTER TABLE users MODIFY COLUMN phone bigint(16) NOT NULL COMMENT '手机';



然后,分别执行以下SQL:

1、字符串类型查询

EXPLAIN SELECT * FROM users WHERE phone = '2';

执行计划如下:

2、数值型查询

EXPLAIN SELECT * FROM users WHERE phone = 2;

执行计划如下:

执行后发现,无论是以字符串查询还是以数值型查询都会用到索引。

小结:

  • 当索引字段是数值类型时,数值型或者字符型查询都不影响索引的使用。

  • 当索引字段是字符类型时,数值型查询无法使用索引,字符型查询可正常使用索引。

3、跟进探究

为什么会是这样呢?其根源就是MySQL的隐式类型转换

3.1 什么是隐式类型转换?

在MySQL中,当操作符与不同类型的操作数一起使用时,会发生类型转换以使操作数兼容,则会发生隐式类型转换。

即 MySQL会根据需要自动将数字转换为字符串,或者将字符串转换为数字。



mysql> SELECT 1+'1';
-> 2
mysql> SELECT CONCAT(2,' test');
-> '2 test'

很明显,上面的SQL语句的执行过程中就出现了隐式转化。

从结果我们可以判定,SQL1中将字符串的“1”转换为数字1,而在SQL2 中,将数字2转换为字符串“2”。

3.2 如何避免隐式类型转换?

3.2.1 清楚转换规则

只有当清楚的知道隐式类型转换的规则,才能从根本上避免产生隐式类型转换。



参考MySQL文档相关描述,确定隐式类型转换规则:

1、两个参数至少有一个是 NULL 时,比较的结果也是 NULL,例外是使用 <=> 对两个 NULL 做比较时会返回 1,这两种情况都不需要做类型转换
2、两个参数都是字符串,会按照字符串来比较,不做类型转换
3、两个参数都是整数,按照整数来比较,不做类型转换
4、十六进制的值和非数字做比较时,会被当做二进制串
5、有一个参数是 TIMESTAMP 或 DATETIME,并且另外一个参数是常量,常量会被转换为 timestamp
6、有一个参数是 decimal 类型,如果另外一个参数是 decimal 或者整数,会将整数转换为 decimal 后进行比较,如果另外一个参数是浮点数,则会把 decimal 转换为浮点数进行比较
7、所有其他情况下,两个参数都会被转换为浮点数再进行比较



验证示例:

mysql> SELECT 'aa' + 1;
-> '1'
mysql> show warnings;
+---------+------+----------------------------------------+
| Level | Code | Message |
+---------+------+----------------------------------------+
| Warning | 1292 | Truncated incorrect DOUBLE value: 'aa' |
+---------+------+----------------------------------------+

上述示例中,将字符串 'aa' 和1进行求和,因为 'aa' 和数字1的类型不同,通过上述转换规则并且经查看warnings可以确认:隐式类型转化将字符串转为了 double 类型。

由于字符串是非数字型的,所以就会被转换为0,因此计算结果:0+1=1

3.2.2 使用内置函数显示转换

MySQL对数据进行类型转换,提供了cast() 和 convert()。

相同点:两者都是进行数据类型转换,实现的功能基本等同

不同点:两者的语法不同:cast(value as type) 、 convert(value,type)



将数值型转换为字符串型,应用示例如下:

mysql> SELECT CAST(123 as char);
-> '123'
mysql> SELECT CONVERT(123, char);
-> '123'



假如应用在开篇描述问题的查询中,则如下所示:

EXPLAIN SELECT * FROM users WHERE phone = CAST(123 AS CHAR);

结果所示:

结果显示同应用字符串类型参数一样,可使用索引`idx_phone`。

3.2.3 类型保持一致

最简单的一种,保证查询应用规范,SQL参数类型与数据库中字段类型保持一致即可。

3.3 字符类型转换

另外,关于字符串类型转换的一些补充:

mysql> select '1a2b3c' = 1;
-> 1
mysql> select 'a1b2c3' = 0;
-> 1

从上面的例子可以得出:

  • 如果字符串的第一个字符就是非数字的字符,那么转换为数字就是0;

  • 如果字符串以数字开头,那转换的数字就是开头的那些数字对应的值,直到遇到非数字字符才结束。

4、总结

本文主要从问题入手,继而进行问题引申,最终挖掘出问题根源:MySQL隐式类型转换

同时也告诫我们日常在写SQL时一定要检查参数类型与数据库字段类型是否一致,否则可能造成隐式类型转换,不能正常应用索引,造成慢查询,甚至拖垮整个数据库服务集群。

如果参数不一致,也可以考虑使用CAST函数显性转换成一致类型。

数据表设计及应用绝非易事,需要考虑的因素太多了,大家应用过程注意保持敬畏心。



发布于: 2020 年 09 月 02 日 阅读数: 45
用户头像

架构精进之路

关注

做难事者,必有所得! 2018.02.26 加入

「架构精进之路」公号作者 0x0a年互联网从业经验,能编码、做架构、懂管理,坚持总结、沉淀和分享

评论

发布
暂无评论
隐秘的MySQL类型转换