藏在 Java 数组的背后,你可能忽略的知识点
概念
数组是数据呈线性排列的一种数据结构,它用一组连续的内存空间,来存储一组相同数据类型的数据,表示一组相同类型的数据的集合,具有固定的长度,并且在内存中占据连续的空间。
数组是基本上所有语言都会有的一种数据类型,是我们在开发过程中经常会接触到的,所以我们很有必要了解数组的相关特性
数组的定义和使用需要通过方括号 []
。
Java 中,数组是一种引用类型。
Java 中,数组是用来存储固定大小的同类型元素。
区别于 C/C++数组
存储结构区别:
C 数组:数组空间是一次性给定的,优先访问低地址,自底向上而放元素。
在内存中是连续存储的,并且所有数组都是连续的,都可作为一维数组看待。
同时,C 数组是可以动态申请内存空间的,也就是可以动态扩容的,而 Java 数组是不行的,当然 Java 也提供了ArrayList
动态数组类
如下图,一个二维数组就可以看成一个一维数组,只是里面存放的元素为一维数组。所以 C 中的数组是呈线性结构
Java 中的数组就不一样,在 Java 中,数组都是引用实体变量,呈树形结构,每一个叶子节点之间毫无关系,只有引用关系,每一个引用变量只引用一个实体。
Java数组
是会做边界检查的,所以当你越界访问时,会抛出 RuntimeException,而在 C 或 C++是不做边界检查的
如图,上面的例子是这样表示的。在堆内存中,各个一维数组的元素是连续的,但各个一维数组之间不是连续存放的。
数组是对象吗?
C 语言是面向过程的语言,在这里不讨论
C++中的数组不是对象,只是一个数据的集合,而 Java 中的数组是对象,这一点在后面会讲到和验证
区别于容器
Java 中,容器是用来保存多个对象的东西.严格来说是保存对象的引用.因为对象实际的数据是放在另外的地方的.放在容器中的只是指向那块内存区域的一个标识
Java 中,既然有了强大的容器,是不是就不需要数组了?答案是不
诚然,大多数情况下,应该选择容器存储数据。
数组和容器的区别有:效率
、类型识别
、以及存放基本类型的能力
1、Java 中,数组是一种效率最高的存储和随机访问对象引用序列的方式。数组的效率要高于容器(如 ArrayList
)
2、类型识别方面,Java 容器List
、Set
和Map
在处理对象的时候就好像这些对象都没有自己的类型一样,容器将它所含的元素都看根类Object
类型,这样我们只需创建一种容器,就能把所有的类型的对象全部放进去。但是当取出数据时,需要我们自己进行类型转换,这个问题在Java
引入泛型进行类型检查后,与容器类一起使用就可以解决类型转换的问题
3、数组可以持有值类型,而容器则不能(必须用到包装类)
数组特性
随机访问
非随机访问:就是存取第 N 个数据时,必须先访问前(N-1)个数据 (链表)
随机访问:就是存取第 N 个数据时,不需要访问前(N-1)个数据,直接就可以对第 N 个数据操作(数组)
数组是如何做到随机访问的?
事实上,数组的数据是按顺序存储在内存的连续空间内的,从上面的图我们看出来,即便Java
二维数组是呈树形结构,但是各个一维数组的元素是连续的,通过 arr[0],arr[1]等数组对象指向一维数组,所以每个数据的内存地址(在内存上的位置)都可以通过数组下标算出,我们也就可以借此直接访问目标数据,也就是随机访问
Java 数组与内存
上面这么说还是有点懵懵懂懂的,可以画图解看看 Java 数组在内存中的存储是怎么样的?
数组对象(类比看作指针)存储在栈中,数组元素存储在堆中
一维数组:
二维数组:
精彩点评:一维数组在堆上连续的内存空间直接存储值,二维数组在连续的地址上存储一维数组的引用地址,一维数组与一维数组并不一定靠在一起,但是这些一维数组内部的值是在连续地址上的。更高维的数组继续以此类推,只有最后一维数组在连续地址上保存值,其他纬度均在连续地址上保存下一维度的引用地址。同维度的实例不一定靠在一起。
解惑
数组下标为什么是从 0 开始?
前面说到数组访问数据时使用的是随机访问(通过下标可计算出内存地址),从数组存储的内存模型上来看,“下标”最确切的定义应该是“偏移(offset)”。如果用 a 来表示数组的首地址,a[0] 就是偏移为 0 的位置,也就是首地址,a[k] 就表示偏移 k 个 type_size 的位置,所以计算 a[k] 的内存地址只需要用这个公式:
但是,如果数组从 1 开始计数,那我们计算数组元素 a[k] 的内存地址就会变为:
对比两个公式,可以发现,从 0 开始编号,每次随机访问数组元素都少了一次减法运算,对于 CPU 来说,就是少了一次减法指令, 提高了访问的效率
数组的本质
Java 中的数组是对象吗?
Java 和 C++都是面向对象的语言。在使用这些语言的时候,我们可以直接使用标准的类库,也可以使用组合和继承等面向对象的特性构建自己的类,并且根据自己构建的类创建对象。那么,我们是不是应该考虑这样一个问题:在面向对象的语言中,数组是对象吗?
判断数组是不是对象,那么首先明确什么是对象,也就是对象的定义。在较高的层面上,对象是根据某个类创建出来的一个实例,表示某类事物中一个具体的个体。对象具有各种属性,并且具有一些特定的行为。而在较低的层面上,站在计算机的角度,对象就是内存中的一个内存块,在这个内存块封装了一些数据,也就是类中定义的各个属性,所以,对象是用来封装数据的。以下为一个 Person 对象在内存中的表示:
注意:
1、红色矩形表示一个引用(地址)或一个基本类型的数据,绿色矩形表示一个对象,多个红色矩形组合在一块,可组成一个对象。
2、name 在对象中只表示一个引用, 也就是一个地址值,它指向一个真实存在的字符串对象。在这里严格区分了引用和对象。
那么在 Java 中,数组满足以上的条件吗?在较高的层面上,数组不是某类事物中的一个具体的个体,而是多个个体的集合。那么它应该不是对象。而在计算机的角度,数组也是一个内存块,也封装了一些数据,这样的话也可以称之为对象。以下是一个数组在内存中的表示:
这样的话, 数组既可以是对象, 也可以不是对象。至于到底是不是把数组当做对象,全凭 Java 的设计者决定。数组到底是不是对象, 通过代码验证:
从上面的代码来看,在数组 arr 上, 可以访问它的属性,也可以调用一些方法。这基本上可以认定,Java 中的数组也是对象,它具有 java 中其他对象的一些基本特点:封装了一些数据,可以访问属性,也可以调用方法。所以答案是肯定的,数组是对象。
同时权威的Java Language Specification是这么说的:
In the Java programming language, arrays are objects (§4.3.1), are dynamically created, and may be assigned to variables of type Object (§4.3.2). All methods of class Object may be invoked on an array.
这里我就不给大家翻译了,看不懂的有道翻译一下
补充:Java Language Specification 里关于 Array 还有这么一段:
Every array has an associated Class object, shared with all other arrays with the same component type. [ This] acts as if: the direct superclass of an array type is Object [ and] every array type implements the interfaces Cloneable and java. io. Serializable.
数组对象不是从某个类实例化来的,而是由 JVM 直接创建的。实际上也没有 Array 这个类(有是有,但只是java.lang.reflect
包里的一个反射类)。但每个数组都对应一个 Class 对象。通过 RTTI(Run-Time Type Information)可以直接检查Array
的运行时类型,以及它的签名,它的基类,还有其他很多事。在 C++中,数组虽然封装了数据,但数组名只是一个指针,指向数组中的首个元素,既没有属性,也没有方法可以调用。如下代码所示:
所以 C++中的数组不是对象,只是一个数据的集合,而不能当做对象来使用。
Java 中数组的类型
Java 是一种强类型的语言。既然是对象, 那么就必须属于一个类型,比如根据 Person 类创建一个对象,这个对象的类型就是 Person。那么数组的类型是什么呢?看下面的代码:
arrI
的类型为[ I
,arrS
的类型是[Ljava.lang.String;
, arrsS
的类型是[[Ljava.lang.String
;
所以,数组也是有类型的。只是这个类型显得比较奇怪。你可以说arrI
的类型是int[]
,这也无可厚非。但是我们没有自己创建这个类,也没有在Java
的标准库中找到这个类。也就是说不管是我们自己的代码,还是在JDK
中,都没有如下定义:
这只能有一个解释,那就是这个数组对象并不是从某个类实例化来的,而是由 JVM 直接创建的,同时这个直接创建的对象的父类就是 Object,所以可以调用 Object 中的所有方法,包括你用到的 toString()。
我们可以把数组类型和 8 种基本数据类型一样, 当做 Java 的内建类型,这种类型的命名规则是这样的:
每一维度用一个[表示;开头两个[,就代表是二维数组。
[后面是数组中元素的类型(包括基本数据类型和引用数据类型)
在 Java 语言层面上,arrS
是数组,也是一个对象,那么它的类型应该是String[]
,这样说是合理的。但是在JVM
中,他的类型为[java.lang.String
。顺便说一句普通的类在 JVM 里的类型为 包名+类名,也就是全限定名。同一个类型在Java
语言中和在虚拟机中的表示可能是不一样的。
Java 中数组的继承关系
上面已经验证了,数组是对象,也就是说可以以操作对象的方式来操作数组。并且数组在虚拟机中有它特别的类型。既然是对象,遵循 Java 语言中的规则 -- Object 是上帝, 也就是说所有类的顶层父类都是 Object。数组的顶层父类也必须是 Object,这就说明数组对象可以向上直接转型到 Object,也可以向下强制类型转换,也可以使用 instanceof 关键字做类型判定。 这一切都和普通对象一样。如下代码所示:
评论