你真的理解 Java 的基础数据类型吗
Java 中的基础数据类型有 8 种,分别是:byte, boolean, short, char int, float, long double。
如果要理解这些基础类型如何存储数据,需要知道两个基础知识:
所有数据都是使用二进制表示
数值类型一律使用补码来表示
本文基于 JDK1.8
整数类型
byte 是存储整数的最小类型,只占 1 个字节,因为还需要表示负数,因此只能保存 -128 ~ 127 范围内的数据。
如果把一个超出范围的数值赋值给 byte 会怎么样?
直接赋值无法编译通过:
需要通过强转才能编译通过,但得到值不是我们所期望的:
为什么会出现这样的结果呢?
129 使用二进制表示就是 10000001,但因为所有的数值类型都是使用补码来表示,在强制转换之后,第一位会被认为是符号位,表示负数。
负数补码的反码是除符号位以外取反,所以是:11111110。
负数的原码是反码加1,所以是 11111111,也就是 -127。
short,int,long 与 byte 没有太大区别,唯一的区别就在于占据的字节数量不一样。
short 占据 2 个字节,表示的范围是: -32768 ~ 32767
int 占据 4 个字节,表示的范围是:-2147483648 ~ 2147483647
long 占据 8 个字节,表示的范围是:-9223372036854775808 ~ 9223372036854775807
浮点数类型
Java 中的浮点数有 float 和 double 两种,按照 IEEE754 标准来实现,分别占 4 个字节和 8 个字节。
以 float 来说,总共有 32 位:
float 同样也有符号,所以第 1 位是符号位 (s),后面 8 位是指数位(e),最后面 23 位表示的是小数位(m),形式如下:
这是需要注意的是因为是二进制,所以基数是 2,因为指数 e 有 8 位,所以范围是 -128 ~ 127。
比如说有一个浮点数:1001.11,按照上面的形式,如下:
因为浮点数的小数位会因为精度的问题而出现变化,所以不能使用 == 去比较两个浮点数,否则可能出现意想不到的情况。
double 除了位数不一样,其他与 float 一致。
布尔类型
boolean 的情况比较特殊,boolean 赋值时只能选择 true 或者 false,无法赋值其他的值。
但是在编译时会将 false 换成 0,将 true 换成非零数。
字符类型
由于 Java 使用的是 Unicode,所以作为基本的字符单元,char 使用了 2 个字节的空间,char 实际存储的是该字符在 Unicode 字符集内中的排序位置,即整数。
每个 char 只能存储一个字符,所以存储一些英文字符时会浪费一些空间。
在 Java8 之前,String 使用 char 数组来存储字符串,但是从 Java 9 以后,已经替换成 byte 数组了,因为更加灵活,而且存储的效率也更高。
版权声明: 本文为 InfoQ 作者【Rayjun】的原创文章。
原文链接:【http://xie.infoq.cn/article/c50bf16911c665dff87ec6972】。文章转载请联系作者。
评论