深度剖析“八大排序”(上)_ 探寻一些不为人知的细节
前情提要
本章节是数据结构
的八大排序(一)
的相关知识~
接下来我们即将进入一个全新的空间,对代码有一个全新的视角~
以下的内容一定会让你对数据结构
有一个颠覆性的认识哦!!!
❗以下内容以C语言
的方式实现,对于数据结构
来说最重要的是思想
哦❗
以下内容干货满满,跟上步伐吧~
💡本章重点
深入了解与实现
插入排序
深入了解与实现
选择排序
🍞一.插入排序
💡基本思想:
把待排序的记录按其关键码值的大小,逐个插入到一个已经排好序的
有序序列
中,直到所有的记录插入完为止,得到一个新的有序序列
👆简单来说:
就是类似于
打扑克牌
面对待排序的牌组一样,将牌组的一端作为排序的开端【即上述的有序序列
】,然后将剩下的牌【即待排元素
】不断一个一个地往有序序列
中插入到应有的位置上去
而对于插入排序
类型最常见的有两种排序算法:
1️⃣直接插入排序
2️⃣希尔排序
👉接下来就让我们来深入了解这两种排序算法吧~
🥐Ⅰ.直接插入排序
💡算法思想:
当插入第 i(i>=1)个元素时,前面的 array[0],array[1],…,array[i-1]已经排好序
此时用 array[i]的排序码与 array[i-1],array[i-2],…的排序码顺序进行比较
找到插入位置即将 array[i]插入,原来位置上的元素顺序后移
➡️算法拆分:
假定有一个待排序数组:⌈3 2 6 8 4 1 9⌋
,排升序
1️⃣将左边第一个元素
⌈3⌋
作为有序区间
的起点2️⃣即此时
原数组
中看似被分为两类数组:有序区间
:此时区间中有一个元素⌈3⌋
待排区间
:区间中元素为⌈2 6 8 4 1 9⌋
3️⃣将
待排区间
中的第一个元素经过与有序区间
中的元素比较后,插入到有序区间
中合适的位置上去【依旧保持有序区间
有序】有序区间
:此时区间中的元素为⌈2 3⌋
待排区间
:区间中元素为⌈6 8 4 1 9⌋
4️⃣重复上述步骤,直至数组完全排序即可
❗特别注意:
上述
算法拆分
中看似是在操作两个区间,但实际上一直都是在原数组
中进行排序【只是逻辑上将原数组
分为两个区间去操作而已】之所以每一次都用
待排数组
中的第一个元素去排序【即有序区间
的下一个元素】,是因为这样子可以更加方便在原数组
中挪动位置进行插入排序不然如果每次都拿最后一个数据去插入排序的话,每次进行比较和插入排序都需要将
整个数组
都往后挪动一次【挪动次数相比较下更多,时间复杂度也随之上升】
✊动图示例:
👉代码实现:
🥐Ⅱ.希尔排序(缩小量排序)
💡算法思想:
先选定一个整数,把待排序文件中所有记录分成个组,所有距离为的记录分在同一组内,并对每一组内的记录进行插入排序
然后,取,重复上述分组和排序的工作。当到达=1 时,所有记录在统一组内排好序
👆算法拆分:
希尔排序的本质:
预排序
➕直接插入排序
预排序
:本质也是插入排序
是对每一小组中的数据进行
插入排序
目的:让整个数组接近有序,使得一开始无序的数组趋向于让
大的数
往后面走,小的数
往前面走直接插入排序
:在经过预排序
使得整个数组接近有序后,就可以更加快速【中间也减少了数据的挪动次数】的将数组进行排序完全
➡️**深入理解预排序
**:
待排数组为:⌈9 1 2 5 7 4 8 6 3 5⌋
,排升序
1️⃣将数组间隔为
gap
的数据分为一组(假定gap
为3
,就会分为gap
组)2️⃣每组内的数据进行
插入排序
即分
⌈9 5 8 5⌋
、⌈1 7 6⌋
、⌈2 4 3⌋
这三组一次
预排序
的动图演示:一趟下来后,数组内为:
⌈5 1 2 5 6 3 8 7 4 9⌋
,可见比一开始的顺序更加接近有序
✨综上:
我们可以发现预排序
:
gap
越大:大的和小的数字可以更快挪动到对应的地方去
但越不接近有序
gap
越小:大的和小的数字可以更慢挪动到对应的地方去
但越接近有序
gap
==1
:本质就是
直接插入排序
👉代码实现:
❗希尔排序的核心:
gap
> 1:预排序
gap
== 1:直接插入排序
在
gap
<= 3 的时候,+1
就可以保证最后一次的gap
必然是1
而且不一定
/3
,可以是任意选择通过控制
gap
从而达到预排序
➕直接插入排序
效果
🥯Ⅲ.总结
💡排序特性:
1️⃣直接插入排序:
元素集合越接近有序,直接插入排序算法的时间效率越高
时间复杂度:
空间复杂度:
稳定性:
稳定
2️⃣希尔排序:
希尔排序
是对直接插入排序
的优化【因为直接插入排序
一开始的排序环境是很恶劣的,但希尔排序
最后是在接近有序的环境下进行排序,所以环境更优】:当 gap > 1 时都是预排序,目的是让数组更接近于有序
当 gap == 1 时,数组已经接近有序的了,这样就会很快
这样整体而言,可以达到
优化
的效果时间复杂度【平均值】:【也可近似看为】
【因为希尔排序的时间复杂度不好计算,因为
gap
的取值方法很多,导致很难去计算,因此在好些书中给出的希尔排序的时间复杂度都不固定】空间复杂度:
稳定性:
不稳定
➡️以上就是插入排序
的相关内容啦,相信大家对插入排序
有不一样的看法了吧🧡
🍞二.选择排序
💡基本思想:
每一次从待排序的数据元素中选出
最小
(或最大
)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完
👆简单来说:
每次从待排序区间中遍历,选出
最大值
(或最小值
)将
最大值
(或最小值
)根据排的顺序(升序
or降序
)放到相应的位置上去重复上述操作直至完全排序
而对于选择排序
类型最常见的有两种排序算法:
1️⃣直接选择排序
2️⃣堆排序
👉接下来就让我们来深入了解这两种排序算法吧~
🥐Ⅰ.直接选择排序
💡算法思想:
与
选择排序
的大致思想基本相同,但有优化方案
➡️算法优化:
每次从待排序区间中遍历,选出
最大值
与最小值
将
最大值
与最小值
根据排的顺序(升序
or降序
)放到相应的位置上去重复上述操作直至完全排序
❗特别注意:
上述的
算法优化
相比于单次选取一个值
进行排序,可一次性选取2
个最值但时间复杂度依旧没有发生变化,仍然是:
最小值
交换的时候可能会对下一步的最大值
交换产生影响:即因为我们寻找最大值与最小值时,记录的是对应的
下标
所以会有时候产生最小值所交换的位置恰好与最大值所在的位置相撞【即
最大值
所在的位置与待排区间
的左边界重合】那此时如果先交换
最小值
,那就会把一开始最大值
所在位置的值给交换走【即原本最大值
的下标指向的就是最大值的位置,但因为最小值
交换后,导致此时最大值
下标指向的并不是真正的最大值
】所以遇见这种情况,我们一般在两次交换的中间加一个
修正
的情况,预防上述问题的发生
✊动图示例:
👉代码实现:
🥐Ⅱ.堆排序
✨
堆排序
在之前的文章中的有详细提到,可以>点击<跳转食用
🥯Ⅲ.总结
💡排序特性:
1️⃣直接选择排序:
地位很尴尬,实际中基本很少使用
时间复杂度:
空间复杂度:
稳定性:
不稳定
2️⃣堆排序:
堆排序使用堆来选数,效率就高了很多
时间复杂度:
空间复杂度:
稳定性:
不稳定
➡️以上就是选择排序
的相关内容啦,相信大家对插入排序
有不一样的看法了吧🧡
🫓总结
综上,我们基本了解了数据结构中的“排序(一)”的知识啦~~
恭喜你的内功又双叒叕得到了提高!!!
感谢你们的阅读
后续还会继续更新,欢迎持续关注哟~
版权声明: 本文为 InfoQ 作者【Dream-Y.ocean】的原创文章。
原文链接:【http://xie.infoq.cn/article/e3eaa3a4790414ebe22fc4326】。未经作者许可,禁止转载。
评论