数组遍历
前言
上一篇 《数组的遍历一:遍历次数的对比》 介绍了遍历次数的比较,本篇介绍遍历性能的对比。
遍历性能对比
题目背景:填充一个固定长度的数组,数组每一项为一个对象,包含一个 id
和 count
。 id
为从 1 开始的自增数字,count
为一个随机数,然后遍历查找到数组的最后一项。
如果提前退出遍历,那耗时肯定会比全部遍历要少,所以这里采用查找最后一项是为了保证所有
API
的遍历次数相同,以便于比较。
这里也会用到2个函数,用来记录从遍历开始和到遍历结束所耗费的时间,单位 ms
。
let id = 1;
// 源数组
const array = Array.from({ length: 500000 }).map((v) => ({ id: id++, count: parseInt(Math.random() * 1000) }));
id = null;
console.log(' array 的长度 >> ', array.length);
let apiName = '';
// 记录开始时间
function tiemStart(api) {
apiName = api;
console.log(' ');
console.log(`${api} 性能测试`);
console.time(apiName);
}
// 记录结束时间
function tiemEnd() {
console.timeEnd(apiName);
apiName = '';
}
// 目标ID
const targetId = 500000;
-
for
: 原生for
循环
// for循环
tiemStart('for');
for (let i = 0; i < array.length; i++) {
const item = array[i];
if (item.id === targetId) {
break;
}
continue;
}
tiemEnd();
-
map
: 遍历数组每一项,返回一个新的数组
// map
tiemStart('map');
array.map((v) => v.id === targetId);
tiemEnd();
-
forEach
:遍历数组每一项,无返回值
// forEach
tiemStart('forEach');
array.forEach((v) => v.id === targetId);
tiemEnd();
-
filter
:检查数组中是否存在符合条件的元素,返回所有符合条件的元素的数组,若无,则返回一个空数组
// filter
tiemStart('filter');
array.filter((v) => v.id === targetId);
tiemEnd();
-
find/findLast
:从开头/末尾检查数组中是否存在符合条件的元素,返回第一个符合条件的元素,若无,则返回undefined
// find/findLast
tiemStart('find');
array.find((v) => v.id === targetId);
tiemEnd();
-
findIndex/findLastIndex
:从开头/末尾检查数组中是否存在符合条件的元素,返回第一个符合条件元素的下标,若无,则返回-1
// findIndex/findLastIndex
tiemStart('findIndex');
array.findIndex((v) => v.id === targetId);
tiemEnd();
-
every
:检查数组的每一项是否都符合条件,返回true | false
// every
tiemStart('every');
// 为了让 every 也能遍历相同次数,这里直接返回一个 true
array.every((v) => true);
tiemEnd();
-
some
:检查数组中是否存在符合条件的元素,返回true | false
// some
tiemStart('some');
array.some((v) => v.id === targetId);
tiemEnd();
总结
结果展示
在测试时,我分别试了数组长度为 5000、1w、5w、10w、50w、80w 的耗时对比,50w 以下的数据耗时波动较大,其整体耗时差距并不明显,到 80w 的时候各个 API
的遍历时间才基本稳定,且有一定的差距。因此最终选取了 100w
和 500w
2个量级做了耗时的比较。
demo
里的数据结构相对简单,所以需要较大的数据量才能有明显的对比,实际业务中可能在更小的量级就能有明显的区别。
- 数组长度为 100w 时的耗时:
- 数组长度为 100w 和 500w 各执行 10 次然后取平均值的结果,并做了排序:
从上图可以看出原生 for
循环的优势是非常明显的,其次是 forEach
,最差的是 map
循环(可能是因为 map
需要返回新的数组,所以需要执行更多的操作),其余几个 API
虽然也有排序,但是整体耗时相差很小。
建议
结合上一篇对遍历次数的比较,在实际业务中,当出现数据量较大(至少10w级)的数组时,遍历建议使用 for
循环,查找单个元素时可以使用 for
或 find
, 因为本身它们的耗时要优于其他 API
,且它们还可以提前退出,查找多个可以使用 for
或 filter
。也可以先将数组使用 for
循环转成 Map<string, Node>
的数据,查找时使用 Map
的 API
也会快很多。
完
网友评论