【数据结构与算法】“堆”还能这样用 _ 堆的应用
前情提要
本章节是数据结构
的堆的应用
的相关知识~
接下来我们即将进入一个全新的空间,对代码有一个全新的视角~
以下的内容一定会让你对数据结构
有一个颠覆性的认识哦!!!
❗以下内容以C语言
的方式实现,对于数据结构
来说最重要的是思想
哦❗
以下内容干货满满,跟上步伐吧~
💡本章重点
堆排序
Top-K 问题
🍞堆的应用
🥐Ⅰ.堆排序
💡堆排序:
本质为选择排序的一种
堆排序便是利用
堆
这种数据结构的思想进行排序
✊如果有同学不太熟悉堆
,可点击⌈跳转⌋补充知识再出发呀
🔥 思想:
每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完
❓思考: 如何利用堆
进行排序
假如排
升序
,我们利用小堆
进行排序的话:我们建好一个小堆后,因为小堆的特性为
最小
的数在根节点处(最上面),我们便排好升序
中的第一个数字此时我们再继续排剩下的数字,便需要在
建堆
的时候剔除已经排好的数字,继而将剩下的重新的建堆
,选最小
的数字重复上述步骤即可
❗特别注意:
如果按照上述方法进行排序的话,有两个问题:
🔴第一次建好堆后,在选出最小的数字放到第一个位置紧接着要选出次小的(即进行第二次建堆选数,谁去做新的根节点),如何选?
Eg:
🟠假如按数组的下标顺下去,让下一个数作为新的根结点(即指上图中的
5
)的话,那树原来的结构就被打乱了,需要重新建堆,才能再次选出最小的建堆的时间复杂度为,那整体排序下来时间复杂度便为
🟡最终发现如果按照这种方式进行排序的话,相当于
建堆
的作用就是选数
,还不如直接遍历数组选数进行排序,那次是堆排序
就没有意义了
⭐但事实真的是这样吗?并不!
➡️方法:
1️⃣建堆
假如我们调转一下思路,排升序
不用小堆
,而是:
升序:建
大堆
降序:建
小堆
Eg:
2️⃣利用
堆删除
的思想进行排序
将
堆顶
的数据与堆尾
数据进行交换,这样就达到排好最大值的效果
将排好的数字不再纳入
建堆
中【即建堆
的目的就是选出最大值
,所以已经选出来的,就无需要再参加】并将交换后产生新的树进行重新
建堆
【因为此时只有根节点发生变化,而左、右子树的关系并没有改变,所以可以利用向下调整算法
进行建堆】
4. 重复上述步骤即可,直至
堆
里只剩下一个元素,才截止
✊动图示例: 完整过程
✊综上:堆排序的代码实现【时间复杂度:】
🥐Ⅱ.Top-K 问题
💡Top - K:
意思就是:求数据中
前K个
最大的元素或者最小的元素比如:在高考出成绩时,需要对全省考生的成绩进行排序并取出前 50 名考生的成绩进行封锁,此时就涉及
Top-K
问题了
👉我们便以题目去理解它吧~
🏷️最小的 K 个数【难度:简单】
:mag:题目传送门:
输入整数数组 arr
,找出其中最小的 k
个数
例如,输入 4、5、1、6、2、7、3、8 这 8 个数字,则最小的 4 个数字是 1、2、3、4
示例 1:
示例 2:
💡解题关键: 找出前K
个最小的元素
➡️ 思路一:堆排序
利用我们刚刚所学的
堆排序
,对数组进行排序,然后取出前K
个即可
❗特别注意:
我们需要自己先实现一个
堆排序
,再进行使用在用完
堆
后,记得销毁,否则会造成内存泄露
👉实现:
💫但目前
堆排序
的效率为:,是否还能优化呢?⭐答案是可以的
➡️ 思路二: 建堆
根据题意,我们只需要取出最小的前
K
个数即可,那我们便可以不对数组进行排序,而是利用小堆
的特性:每个父亲结点的值总是≤
孩子结点的值只需要对这个数组进行
建堆
(建成小堆)即可,然后每次都取出根节点
(最小值),一共取K
次,便是最小的前K
个元素
❗特别注意:
我们需要自己先实现一个
堆
,再进行使用
👉实现:
1️⃣实现堆
2️⃣实现Top-K
💫但目前
堆
的效率为:,是否还能优化呢?⭐答案是可以的
➡️ 思路三: 建前 K 个数的堆
类似于
建堆
的操作,但不同的是,建堆
是对数组内全部元素进行调整但我们现在只需要针对前
K
个数进行建堆即可
❗特别注意:
找前
k
个最大的元素,则建小堆
找前
k
个最小的元素,则建大堆
👉步骤:
1️⃣用数据集合中前
K
个元素来建堆【因为这里需要找前K
个最小的元素,所以建大堆
】2️⃣剩余的
N-K
个元素(N
为总元素个数)依次与堆顶元素来比较,不满足则替换堆顶元素,再向下调整3️⃣将剩余
N-K
个元素依次与堆顶元素比完之后,堆中剩余的K
个元素就是所求的前K
个最小或者最大的元素
【我们现在这里建的是大堆
,如果与堆顶元素比较时,外面的某个元素小于
堆顶的值,则为不满足】
❗特别注意:
🔴本质:通过数组剩下的
N-K
个元素,找到比前K
个元素的堆中的堆顶
元素小的元素,进行轮换1️⃣即在剩下的元素中,找到比堆顶还小的元素,不断轮换
堆
中元素的最大值2️⃣因为要找的是最小的
K
个元素,所以最小的前K
个一定比大堆堆顶
的数据小,一定可以进堆中🟡这也是为什么建
大堆
的原因,保证前K
个最小的元素中的最小值进来一定不会在堆顶
位置(以防前K
个最小的元素中的最大值进不来)🔵现在即使是前
K
个最小的元素中的最大值进堆,那前K-1
个最小的元素还是依然可以进堆🟣直至这
K
个数据的堆不再进入元素,说明此时堆内的K
个数据就是前K
个最小的元素【堆外面没有比这K
个元素更小的数了】
⭐亮点:
1️⃣在面对大量数据且无论多大的时候,需要解决
Top-K
问题时,这个方法依然受用,因为我们始终是在维护一个K
个数的堆【只需要遍历剩下的元素进行比较、进堆、向下调整而已】2️⃣此方法的时间复杂度始终为:
这是因为需要遍历
N-K
个元素与堆顶元素进行比较若不满足进堆后,需要向下调整(有
K
个元素进行向下调整)【】3️⃣此方法的空间复杂度为:
✊动图示例:
👉实现:
1️⃣实现建堆
2️⃣实现Top-K
🥯Ⅲ.总结
✨综上:就是堆的应用啦~
➡️相信大家对堆的应用
有不一样的看法了吧🧡
🫓总结
综上,我们基本了解了数据结构中的“堆的应用”的知识啦~~
恭喜你的内功又双叒叕得到了提高!!!
感谢你们的阅读
后续还会继续更新,欢迎持续关注哟~
版权声明: 本文为 InfoQ 作者【Dream-Y.ocean】的原创文章。
原文链接:【http://xie.infoq.cn/article/c703a15829b97a1a8ad371536】。未经作者许可,禁止转载。
评论