数组的 sort() 方法详解
纸上得来终觉浅,绝知此事要躬行!
在上一篇文章中,我们简单介绍了 arr.sort()
方法的基本使用:
用归用,照葫芦画瓢不难,大家日常也是这么写的,没毛病!但是如果对一个方法不进行深入研究,那么就很容易踩坑,并且常常会填不了坑!
今天,我们重点聊聊比较函数 compareFunction
相关的知识。
为了接下来的思路能够更顺畅,在学习比较函数之前,我们先来了解一下有关插入排序的原理。
插入排序
插入排序(Insertion-Sort)的算法描述是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。
算法描述:
一般来说,插入排序都采用 in-place 在数组上实现:
从第一个元素开始,该元素可以认为已经被排序;
取出下一个元素,在已经排序的元素序列中从后向前扫描;
如果该元素(已排序)大于新元素,将该元素移到下一位置;
重复步骤 3,直到找到已排序的元素小于或者等于新元素的位置;
将新元素插入到该位置后;
重复步骤 2~5。
动图演示:
其实可以用一句话总结:从数组中第二个元素起(第一个元素已默认排序),每个元素都充当一次游标值,依次和它前面的(已排序)的元素相比较,如果游标值小,则将拿来比较的元素向后移一位,继续向前比较;否则,将游标值插入比较值的后面,结束比较。
关于比较函数 compareFunction
如果想要 sort()
方法按照一定的规则进行排序(比如数字大小),那么就需要给它指定比较函数 compareFunction
。
如果指明了 compareFunction
,那么数组会按照调用该函数的返回值排序,它有两个参数 a
和 b
,返回值如下:
如果
compareFunction(a, b)
小于 0 ,那么 a 会被排列到 b 之前。如果
compareFunction(a, b)
等于 0 , a 和 b 的相对位置不变。如果
compareFunction(a, b)
大于 0 , b 会被排列到 a 之前。compareFunction(a, b)
必须总是对相同的输入返回相同的比较结果,否则排序的结果将是不确定的。
<img src="https://gitee.com/yinyiwang/blogImages/raw/master/images/20210608%20/15-48-16-WecTrT.jpg" alt="question-mark-2318030_1280" style="zoom:50%;" />
compareFunction 初步探究
我们暂不做什么复杂的分析,先使用控制台打印一下看看 a 和 b 到底是什么:
执行结果如下:
通过上图,我们可以看到:
a 的值在按照原数组中的顺序依次变化,这个排序采用的应该是插入排序法。
a 代表的应该是游标。
从 b 值的变化上又可以看出,a 首次找位置时采用了二分法,a < b 则向前比较, a>b 则向后比较。
那么,其机理到底是不是我们所看到这样一个过程,还需要再探究。
compareFunction 深入探究
要想弄清楚一个问题,还有什么比从根源上着手效率更高的呢?所以我们追根溯源,先来扒一扒 v8引擎
的源码,看看它内部到底是怎么实现 sort
接口的。
下面的源码来自 7.2 版本之前的 v8,该版本之后的数组排序实现变化较大,暂不予讨论。
其中 array.js 文件下,关于 sort 接口实现的代码如下:
代码分析:
v8 中实现 sort() 方法时,采用了 ”插入排序“ 和 ”快速排序“ 两种排序方式。
对于短数组(长度 <= 22)来说,插入排序效率更高。
如果没有传入
comparefn
,则生成一个comparefn
比较函数。在自动生成的比较函数中,会将传入的数组元素通过
TO_STRING
方法转换为字符串,再行比较。对比比较函数中的 b 为游标值,这一点和最新版的 chrome 浏览器表现不同。
我们在 sort 方法中传入的函数用在了这里:
根据我们传入函数的返回值,数组进行排序操作:
如果返回值
(a-b)
大于 0,即a > b
, 则将当前拿来比较的值 a 复制给它的下一位,并继续使用游标值 b 向前进行比较。如果返回值小于等于 0 ,则结束比较,并将游标值 b 填在最后一次比较值 a 的后面。
总结
不管是旧版本还是最新版本的 v8,它们的 sort()
方法的返回结果都没有发生变化,只是内部的实现机理有了改变(肯定是向着更优的方向改变)。
为了是 sort()
的返回结果符合预期,我们给它传入了一个函数作为比较规则。
在比较函数中,因 v8 版本不同,实现机制有差异,导致它的参数意义也不大相同,所以我们暂时无需关心它里面参数的具体含义。
比较函数如果写完全的话,应该是:
即比较函数的返回值严格来说只有三个:-1、0 和 1 。
我们主需要记住 return a - b
是升序排列,return b - a
是降序排列即可。
~本文完
学习有趣的知识,结识有趣的朋友,塑造有趣的灵魂!
大家好!我是〖编程三昧〗的作者 隐逸王,我的公众号是『编程三昧』,欢迎关注,希望大家多多指教!
知识与技能并重,内力和外功兼修,理论和实践两手都要抓、两手都要硬!
版权声明: 本文为 InfoQ 作者【编程三昧】的原创文章。
原文链接:【http://xie.infoq.cn/article/4f546069eaf00569fd531afd8】。
本文遵守【CC BY-NC-ND】协议,转载请保留原文出处及本版权声明。
评论