Java8新特性系列（流性能）

作者: 史培培 | 来源:发表于2017-12-30 13:09 被阅读0次

题图：by pixel2013 From pixabay

上期介绍了Java8中Stream的新特性，本期我们将测试下stream与parallelStream的性能以及应用的场景。

先上代码

public class StreamTest {

    private static final int MAX_INT = 1_000_000;

    public static void stream() {
        List<String> list = new ArrayList<>();
        IntStream.range(0, MAX_INT).forEach(value -> {
            UUID uuid = UUID.randomUUID();
            list.add(uuid.toString());
        });

        long startTime = System.nanoTime();

        list.stream().sorted().collect(Collectors.toList());

        long endTime = System.nanoTime();
        long durationTime = TimeUnit.NANOSECONDS.toMillis(endTime - startTime);
        System.out.println("stream execute time : " + durationTime);
    }

    public static void parallelStream() {
        List<String> list = new ArrayList<>();
        IntStream.range(0, MAX_INT).forEach(value -> {
            UUID uuid = UUID.randomUUID();
            list.add(uuid.toString());
        });

        long startTime = System.nanoTime();

        list.parallelStream().sorted().collect(Collectors.toList());

        long endTime = System.nanoTime();
        long durationTime = TimeUnit.NANOSECONDS.toMillis(endTime - startTime);
        System.out.println("parallelStream execute time : " + durationTime);
    }

    public static void main(String[] args) {
        stream();
        parallelStream();
    }
}

MAX_INT = 1_000_000; //Jav8中数字可以用_间隔，类似1,000,000

Max_INT为1时，结果为：
stream execute time : 6
parallelStream execute time : 8

Max_INT为100时，结果为：
stream execute time : 7
parallelStream execute time : 7

Max_INT为1_000时，结果为：
stream execute time : 15
parallelStream execute time : 22

Max_INT为10_000时，结果为：
stream execute time : 28
parallelStream execute time : 21

Max_INT为100_000时，结果为：
stream execute time : 98
parallelStream execute time : 62

Max_INT为1_000_000时，结果为：
stream execute time : 742
parallelStream execute time : 429

Max_INT为5_000_000时，结果为：
stream execute time : 4299
parallelStream execute time : 2191

Max_INT为10_000_000时，结果为：
stream execute time : 9849
parallelStream execute time : 6923

分析

并行适用的场景？

有大量的元素要处理
性能问题是首要考虑的
没有在一个多线程的环境中

所以如Java Web应用，底层都是Servlet，我们知道，Servlet是多线程的，所以在web应用中并行流并不适用，而对于数据的处理、算法的验证等单线程环境是适用的。

原理

并行流底层其实是ForkJoinPool ，用的是分治法，即Fork/Join方法

当执行新的任务时它可以将其拆分分成更小的任务执行，并将小任务加到线程队列中，然后再从一个随机线程的队列中偷一个并把它放在自己的队列中。

相对于一般的线程池实现，fork/join框架的优势体现在对其中包含的任务的处理方式上，在一般的线程池中，如果一个线程正在执行的任务由于某些原因无法继续运行,那么该线程会处于等待状态。而在fork/join框架实现中，如果某个子问题由于等待另外一个子问题的完成而无法继续运行.那么处理该子问题的线程会主动寻找其他尚未运行的子问题来执行。这种方式减少了线程的等待时间，提高了性能。

public static void main(String[] args) {
    ForkJoinPool pool = ForkJoinPool.commonPool();
    System.out.println(pool.getParallelism());
}

结果：
3

我们可以通过参数来修改：

WX20171230-125634@2x.png

结果：
10

总结

如何高效使用并行流？

如果用循环还是顺序流或者是并行流，像我们上面那样测试一下；
注意装箱，尽量使用IntStream, LongStream，和DoubleStream来避免装箱拆箱;
有些操作在并行流上性能很差，比如limit，findFirst等依赖顺序的操作。unordered方法可以把有序流转为无序流，使用findAny等好很多，在无序流上用limit也好很多;
计算流水线操作总成本，处理单个元素用时越多，并行就越划算；
对于较小的数据量，用并行不一定是好事儿；
区分单线程和多线程，多线程下并行不一定是好事儿；
数据结果是否易于分解，比如ArrayList比LinkedList易于分解，range创建的原始流也易于分解；
终端操作中的合并大家是否很大，大了也不划算。

网友评论

本文标题：Java8新特性系列（流性能）

本文链接：https://www.haomeiwen.com/subject/vmiggxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Java8新特性系列（流性能）

先上代码

分析

原理

总结

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

技术干货

程序猿阵线联盟-汇总各类技术干货

阿里云