美文网首页Java 杂谈
高效遍历Java容器

高效遍历Java容器

作者: 传奇内服号 | 来源:发表于2018-09-04 15:23 被阅读11次

通过本文,你可以更深入的学习 Java 语言中 forEach 语法的知识,以及它和 C 语言形式的 for 循环、 Steam API 的对比。

简介

Java 程序员经常使用容器,比如 ArrayList 和 HashSet。Java 8 中的 lambda 语法和 steaming API 可以让我们更方便的使用容器。大部分情况下,我们仅仅处理几千个元素,也不会去考虑性能问题。但是,在一些极端场景下,如果我们需要遍历上百万个元素,性能问题就凸显出来了。

本文将采用JMH计算每块代码的运行时间。

forEach vs. C Style vs. Stream API

遍历是一个基本的功能。所有编程语言都提供了简单的语法,让程序员去遍历容器。Steam API 以一种非常直接的形式来遍历容器。

publicList streamSingleThread(BenchMarkState state){

    List result = newArrayList<>(state.testData.size());

    state.testData.stream().forEach(item -> {

        result.add(item);

    });

    returnresult;

}

publicList streamMultiThread(BenchMarkState state){

    List result = newArrayList<>(state.testData.size());

    state.testData.stream().parallel().forEach(item -> {

        result.add(item);

    });

    returnresult;

}

forEach 循环也很简单:

publicList forEach(BenchMarkState state){

  List result = newArrayList<>(state.testData.size());

  for(Integer item : state.testData){

    result.add(item);

  }

  returnresult;

}

C 语言形式的 for 循环啰嗦一些,不过依然很紧凑:

publicList forCStyle(BenchMarkState state){

  intsize = state.testData.size();

  List result = newArrayList<>(size);

  for(intj = 0; j < size; j ++){

    result.add(state.testData.get(j));

  }

  returnresult;

}

以下是性能报告:

Benchmark                               Mode  Cnt   Score   Error  Units

TestLoopPerformance.forCStyle           avgt  200  18.068 ± 0.074  ms/op

TestLoopPerformance.forEach             avgt  200  30.566 ± 0.165  ms/op

TestLoopPerformance.streamMultiThread   avgt  200  79.433 ± 0.747  ms/op

TestLoopPerformance.streamSingleThread  avgt  200  37.779 ± 0.485  ms/op

使用 C 语言形式的 for 循环,JVM 每次仅仅增加一个数字,然后直接从内存里读出数据。这使得它非常迅速。但是 forEach 就大不一样,根据StackOverFlow 的这篇回答,和Oracle 的文章,JVM 需要把 forEach 转换成一个 iterator,然后每个元素都调用一次 hasNext() 方法。这就是 forEach 比 C 语言的形式慢一些的原因。

哪一个是遍历 Set 最高效的方法呢?

我们先定义测试数据集:

@State(Scope.Benchmark)

publicstaticclassBenchMarkState {

    @Setup(Level.Trial)

    publicvoiddoSetup() {

        for(inti = 0; i < 500000; i++){

            testData.add(Integer.valueOf(i));

        }

    }

    @TearDown(Level.Trial)

    publicvoiddoTearDown() {

        testData = newHashSet<>(500000);

    }

    publicSet testData = newHashSet<>(500000);

}

Java 中的 Set 也支持 Steam API 和 forEach 循环。参考之前的测试,如果我们把 Set 转换成 ArrayList,然后遍历 ArrayList,或许性能会好一些?

publicList forCStyle(BenchMarkState state){

    intsize = state.testData.size();

    List result = newArrayList<>(size);

    Integer[] temp = (Integer[]) state.testData.toArray(newInteger[size]);

    for(intj = 0; j < size; j ++){

        result.add(temp[j]);

    }

    returnresult;

}

如果把 iterator 和 C 语言形式结合起来呢?

publicList forCStyleWithIteration(BenchMarkState state){

    intsize = state.testData.size();

    List result = newArrayList<>(size);

    Iterator iteration = state.testData.iterator();

        for(intj = 0; j < size; j ++){

            result.add(iteration.next());

        }

    returnresult;

}

或者,简单的遍历怎么样?

publicList forEach(BenchMarkState state){

    List result = newArrayList<>(state.testData.size());

    for(Integer item : state.testData) {

        result.add(item);

    }

    returnresult;

}

这个主意不错,不过它的效率也不高,因为初始化一个新的 ArrayList 同样需要消耗资源。

Benchmark                                   Mode  Cnt  Score   Error  Units

TestLoopPerformance.forCStyle               avgt  200  6.013 ± 0.108  ms/op

TestLoopPerformance.forCStyleWithIteration  avgt  200  4.281 ± 0.049  ms/op

TestLoopPerformance.forEach                 avgt  200  4.498 ± 0.026  ms/op

HashMap (使用 HashMap 的 HashSet) 不是为遍历所有元素设计的。遍历一个 HashMap 最快的方法是把 Iterator 和 C 语言形式结合起来,这样 JVM 就不会去调用 hasNext()。

结论

Foreach 和 Steam API 用来处理集合是很方便的。你可以更快的写代码。不过,如果你的系统很稳定,性能是一个主要的考量,你应该考虑一下重写你的循环。

相关文章

  • 高效遍历Java容器

    通过本文,你可以更深入的学习 Java 语言中 forEach 语法的知识,以及它和 C 语言形式的 for 循环...

  • 高效遍历Java容器

    通过本文,你可以更深入的学习 Java 语言中 forEach 语法的知识,以及它和 C 语言形式的 for 循环...

  • 高效遍历 Java 容器

    原文:dzone翻译:ImportNew.com-yizhe译文:http://www.importnew.com...

  • 高效遍历Java容器

    通过本文,你可以更深入的学习 Java 语言中 forEach 语法的知识,以及它和 C 语言形式的 for 循环...

  • 高效遍历Java容器

    通过本文,你可以更深入的学习 Java 语言中 forEach 语法的知识,以及它和 C 语言形式的 for 循环...

  • 高效遍历Java容器

    Java 程序员经常使用容器,比如 ArrayList 和 HashSet。Java 8 中的 lambda 语法...

  • Java 集合框架的迭代器

    Java的容器ArrayList、LinkedList、HashSet等可遍历容器,因为不想暴露底层结构,都会实现...

  • QT 容器及遍历

    QT容器遍历分为Java和STL遍历 STL风格遍历器的语法类似于使用指针对数组的操作。我们可以使用++和--运算...

  • Java面试-容器的遍历

    当我们用增强for循环遍历非并发容器(HashMap、ArrayList等),如果修改其结构,会抛出异常Concu...

  • 二叉树的遍历

    前序遍历 python java 后序遍历 java python 中序遍历 java python

网友评论

    本文标题:高效遍历Java容器

    本文链接:https://www.haomeiwen.com/subject/uoggwftx.html