你了解集合？那你倒是给我说说啊！【1】

作者：XiaoLin_Java

2021 年 12 月 08 日
本文字数：4531 字
阅读完需：约 15 分钟

一、数据结构

数据结构就是计算机存储、组织数据的方式。

在计算机科学中，算法的时间复杂度是一个函数，它定性描述了该算法的运行时间，常用 O 符号来表述。时间复杂度是同一问题可用不同算法解决，而一个算法的质量优劣将影响到算法乃至程序的效率。算法分析的目的在于选择合适算法和改进算法

1.1、线性结构

1.1.1、数组

我们对数组的 CRUD 操作进行性能分析

添加操作

如果保存在数组的最后一个位置，至少需要一次操作

如果保存的位置在数组的第一个位置，那么如果存在 N 个元素，那么此时后面的元素需要整体后移，此时需要操作 N 次

那么平均就是（N+1）/2 次，如果需要扩容，那么性能会更低

删除操作

如果删除的是最后一个元素，那么需要操作一次

如果操作的是第一个元素，那么其他元素需要整体前移，需要操作 N 次

平均就是（N+1）/2 次

修改操作

给定索引时，仅仅只是操作一次

查询操作

根据索引操作 1 次，如果根据内存查询的话需要操作 N 次

总结·

基于数组的数据结构做查询和修改事宜非常快的（性能很高），如果做删除和增加就比较慢了，那如果想保证保存和删除操作的性能，此时就得提链表这种数据结构了

1.1.2、链表

链表（类似火车和火车车厢）是由一系列结点 node（链表中每一个元素称为结点）组成，结点可以在运行时 i 动态生成。每个结点包括两个部分：一个是存储数据元素的数据域，另一个是存储下一个结点地址的指针域。

我们常说的链表结构有单向链表与双向链表分为两种：

单向链表：只能从头到尾（从尾到头）遍历
双向链表：既可以从头到尾又可以从尾到头遍历
对链表操作的性能分析

增加操作

仅仅只是操作 1 次，断掉链和新增链

删除操作

仅仅只是操作 1 次

修改操作

如果修改的是第一个元素，那么需要操作 1 次，如果需要修改的是最后一个元素，那么需要操作 N 次，所以平均（N+1）/2

查询操作

如果查询的是第一个元素，那么需要操作 1 次，如果需要查询的是最后一个元素，那么需要操作 N 次，所以平均（N+1）/2

结论

链表的查询和修改性能比较低，而增加和删除性能高

1.1.3、队列

队列是一种特殊的线性表，特殊之处在于它只允许在表的前端（front）进行删除操作，而在表的后端（rear）进行插入操作，队列是一种操作受限制的线性表。

进行插入操作的端称为队尾，进行删除操作的端称为队头，单向队列是先进先出的，只能从队尾插入元素，从对头删除元素

单项队列

双向队列

1.1.4、栈

栈（stack）又名堆栈，它是一种运算受限的线性表，后进先出(LIFO)，和水瓶类似，先装进去的水最后才可以喝到。

栈结构仅允许在表的一端进行插入和删除运算，这一端被称为栈顶，相对地，把另一端称为栈底。向一个栈中插入新元素又称作入栈，它是把新元素放到栈顶元素的上面，使之成为新的栈顶元素。从一个栈中删除元素又称作出栈，表示把栈顶元素删除掉，使其相邻的元素成为新的栈顶元素。

压栈：就是存元素。即，把元素存储到栈的顶端位置，栈中已有元素依次向栈底方向移动一个位置。
弹栈：就是取元素。即，把栈的顶端位置元素取出，栈中已有元素依次向栈顶方向移动一个位置。

1.2、非线性结构

1.2.1、哈希表

数组中的元素在数组中的索引位置是随机的，元素的取值和元素的位置之间没有确定的关系，因此在数组中查找特定的值时，需要将特定的值和整个数组元素进行一个个比较。

此时查询的效率依赖于比较的次数，如果比较的次数比较多，那么此时查询的效率还是不高。

如果此时元素的值（value）和在数组中的索引位置（index）有一个确定的对应关系，我们将这种关系称之为哈希（hash），则元素值和索引之间对应的公式为：index = hash（value），也就是说给定元素值，只要调用了 hash（value）方法，就能找到数组中取值 value 的元素的位置

比方说图中的 hash 的算法公式为：index = value/10-1，在哈希表中存储对象时，该 hash 算法就是对象的 hashCode 方法（真正的 hash 算法并不是这样，只是打个比方，真实的 hash 算法我们大可不必去关心）

在 JDK1.8 之前，哈希表底层采用数组+链表实现，即使用数组处理冲突，同一 hash 值的链表都存储在一个数组里。但是当位于一个桶中的元素较多，即 hash 值相等的元素较多时，通过 key 值依次查找的效率较低。而 JDK1.8 中，哈希表存储采用数组+链表+红黑树实现，当链表长度超过阈值（8）时，将链表转换为红黑树，这样大大减少了查找时间**。简单的来说，哈希表是由数组+链表+红黑树（JDK1.8 增加了红黑树部分）实现的。**

他的存储原理如下图，JDK1.8 引入红黑树大程度优化了 HashMap 的性能，那么对于我们来讲保证 HashSet 集合元素的唯一，其实就是根据对象的 hashCode 和 equals 方法来决定的。如果我们往集合中存放自定义的对象，那么保证其唯一，就必须复写 hashCode 和 equals 方法建立属于当前对象的比较方式。