美文网首页程序员
高效遍历Java容器

高效遍历Java容器

作者: 墨雨轩夏 | 来源:发表于2019-02-18 20:20 被阅读122次

    Java 程序员经常使用容器,比如 ArrayList 和 HashSet。Java 8 中的 lambda 语法和 steaming API 可以让我们更方便的使用容器。大部分情况下,我们仅仅处理几千个元素,也不会去考虑性能问题。但是,在一些极端场景下,如果我们需要遍历上百万个元素,性能问题就凸显出来了。

    本文将采用 JMH 计算每块代码的运行时间。

    forEach vs. C Style vs. Stream API

    遍历是一个基本的功能。所有编程语言都提供了简单的语法,让程序员去遍历容器。Steam API 以一种非常直接的形式来遍历容器。

    publicList streamSingleThread(BenchMarkState state){

    List result =newArrayList<>(state.testData.size());

    state.testData.stream().forEach(item -> {

    result.add(item);

    });

    returnresult;

    }

    publicList streamMultiThread(BenchMarkState state){

    List result =newArrayList<>(state.testData.size());

    state.testData.stream().parallel().forEach(item -> {

    result.add(item);

    });

    returnresult;

    }

    forEach 循环也很简单:

    publicListforEach(BenchMarkState state){

    List result =newArrayList<>(state.testData.size());

    for(Integer item : state.testData){

    result.add(item);

    }

    returnresult;

    }

    C 语言形式的 for 循环啰嗦一些,不过依然很紧凑:

    publicListforCStyle(BenchMarkState state){

    intsize = state.testData.size();

    List result =newArrayList<>(size);

    for(intj =0; j < size; j ++){

    result.add(state.testData.get(j));

    }

    returnresult;

    }

    以下是性能报告:

    Benchmark Mode  Cnt   Score   Error  Units

    TestLoopPerformance.forCStyle avgt20018.068±0.074ms/op

    TestLoopPerformance.forEach avgt20030.566±0.165ms/op

    TestLoopPerformance.streamMultiThread   avgt20079.433±0.747ms/op

    TestLoopPerformance.streamSingleThread  avgt20037.779±0.485ms/op

    使用 C 语言形式的 for 循环,JVM 每次仅仅增加一个数字,然后直接从内存里读出数据。这使得它非常迅速。但是 forEach 就大不一样,根据 StackOverFlow 的这篇回答

    (https://stackoverflow.com/questions/85190/how-does-the-java-for-each-loop-work/85206#85206),

    和 Oracle 的文章

    (https://docs.oracle.com/javase/1.5.0/docs/guide/language/foreach.html),

    JVM 需要把 forEach 转换成一个 iterator,然后每个元素都调用一次 hasNext() 方法。这就是 forEach 比 C 语言的形式慢一些的原因。

    哪一个是遍历 Set 最高效的方法呢?

    我们先定义测试数据集:

    @State(Scope.Benchmark)

    publicstaticclassBenchMarkState{

    @Setup(Level.Trial)

    publicvoiddoSetup(){

    for(inti =0; i <500000; i++){

    testData.add(Integer.valueOf(i));

    }

    }

    @TearDown(Level.Trial)

    publicvoiddoTearDown(){

    testData =newHashSet<>(500000);

    }

    publicSet testData =newHashSet<>(500000);

    }

    Java 中的 Set 也支持 Steam API 和 forEach 循环。参考之前的测试,如果我们把 Set 转换成 ArrayList,然后遍历 ArrayList,或许性能会好一些?

    publicListforCStyle(BenchMarkState state){

    intsize = state.testData.size();

    List result =newArrayList<>(size);

    Integer[] temp = (Integer[]) state.testData.toArray(newInteger[size]);

    for(intj =0; j < size; j ++){

    result.add(temp[j]);

    }

    returnresult;

    }

    如果把 iterator 和 C 语言形式结合起来呢?

    publicListforCStyleWithIteration(BenchMarkState state){

    intsize = state.testData.size();

    List result =newArrayList<>(size);

    Iterator iteration = state.testData.iterator();

    for(intj =0; j < size; j ++){

    result.add(iteration.next());

    }

    returnresult;

    }

    或者,简单的遍历怎么样?

    publicListforEach(BenchMarkState state){

    List result =newArrayList<>(state.testData.size());

    for(Integer item : state.testData) {

    result.add(item);

    }

    returnresult;

    }

    这个主意不错,不过它的效率也不高,因为初始化一个新的 ArrayList 同样需要消耗资源。

    Benchmark     Mode  Cnt  Score   Error  Units

    TestLoopPerformance.forCStyle     avgt2006.013±0.108ms/op

    TestLoopPerformance.forCStyleWithIteration  avgt2004.281±0.049ms/op

    TestLoopPerformance.forEach avgt2004.498±0.026ms/op

    HashMap (使用 HashMap 的 HashSet) 不是为遍历所有元素设计的。遍历一个 HashMap 最快的方法是把 Iterator 和 C 语言形式结合起来,这样 JVM 就不会去调用 hasNext()。

     为了让学习变得轻松、高效,今天给大家免费分享一套Java教学资源。帮助大家在成为Java架构师的道路上披荆斩棘。需要资料的欢迎加入学习交流群:9285,05736

    相关文章

      网友评论

        本文标题:高效遍历Java容器

        本文链接:https://www.haomeiwen.com/subject/aivzeqtx.html