美文网首页《Java 8实战》笔记
【Java 8实战笔记】引入流

【Java 8实战笔记】引入流

作者: 谢随安 | 来源:发表于2017-10-05 01:49 被阅读90次

    引入流

    集合是Java中使用最多的API。几乎每个Java应用程序都会制造和处理集合。但集合的操作却远远算不上完美。

    流是Java API,它允许你以声明性方式处理数据集合。此外流还可以透明性地并行处理,无需写任何多线程代码。

    下面是一个Java 7实现的 返回低热量的菜肴名称并按照卡路里排序:

    List<Dish> lowCaloricDishes = new ArrayList<>();
    for(Dish d: dishes){
        if(d.getCalories() < 400){
            lowCaloricDishes.add(d);
        }
    }
    Collections.sort(lowCaloricDishes, new Comparator<Dish>() {
        public int compare(Dish d1, Dish d2){
            return Integer.compare(d1.getCalories(), d2.getCalories());
        }
    });
    List<String> lowCaloricDishesName = new ArrayList<>();
    for(Dish d: lowCaloricDishes){
        lowCaloricDishesName.add(d.getName());
    }
    

    变量lowCaloricDishes唯一的作用就是作为一次性的中间容器。

    下面是Java 8实现:

    import static java.util.Comparator.comparing;
    import static java.util.stream.Collectors.toList;
    List<String> lowCaloricDishesName = 
        menu.stream()
            .filter(d -> d.getCalories() < 400)
            .sorted(comparing(Dish::getCalories))
            .map(Dish::getName)
            .collect(toList());
    

    为了利用多核架构并行执行这段代码,只需要把 stream() 换成 parallelStream()

    import static java.util.Comparator.comparing;
    import static java.util.stream.Collectors.toList;
    List<String> lowCaloricDishesName = 
        menu.parallelStream()
            .filter(d -> d.getCalories() < 400)
            .sorted(comparing(Dish::getCalories))
            .map(Dish::getName)
            .collect(toList());
    

    使用新的方法 有几个显而易见的好处:

    • 代码时以声明性方式写的
    • 通过把几个基础操作链接起来,来表达复杂的数据处理流水线,同时保持代码清晰可读。

    使用Java 8 的Stream API的优点:

    • 声明性
    • 可复合
    • 可并行

    流简介

    流是什么?简短的定义就是“从支持数据处理操作的源 生成的 元素序列”。

    • 元素序列 ----- 就像集合一样,流也提供一个接口,可以访问特定元素类型的一组有序值。
    • 源 ----- 流会使用一个提供数据的源,如集合、数组或输入/输出资源。
    • 数据处理操作 ----- 流的数据处理功能支持类似于数据库的操作。以及函数式编程语言中的常用操作。

    此外,流操作有两个重要的特点:

    • 流水线 ----- 很多流操作本身会返回一个流,这样多个操作就可以连接起来,形成一个大的流水线。
    • 内部迭代 ----- 与使用迭代器显式迭代的集合不同,流的迭代操作是在背后进行的。

    例如:

    import static java.util.stream.Collectors.toList;
    List<String> threeHighCaloricDishesName = 
        menu.stream()
            .filter(d -> d.getCalories() > 300)
            .map(Dish::getName)
            .limit(3)
            .collect(toList());
        System.out.println(threeHighCaloricDishNames);
    

    在上面示例代码中,先是对menu调用stream方法,由菜单得到一个流。数据源是menu,它给流提供一个元素序列。接下来,对流应用一系列数据处理操作:filter、map、limit和collect。除了collect之外,所有这些操作都会返回一个流,这样就可以连接成一条流水线。最后,collect操作开始处理流水线,并返回结果(它和别的操作不一样,因为它返回的是一个List)。

    在调用collect之前,没有任何结果产生,实际上根本就没有从menu里选择元素,可以理解为:链中的方法调用都在排队等待,直到调用collect。

    • filter ----- 接受Lambda,从流中排除某些元素。
    • map ----- 接受一个Lambda,将元素转换成其他形式或提取信息。
    • limit ----- 截断流,使其元素不超过给定数量。
    • collect ----- 将流转换为其他形式。

    这样做的好处在于,你并没有去实现筛选、提取或截断功能,Stream库已经自带了。

    流与集合

    粗略的说,集合与流之间的差异就在于什么时候进行计算。集合是一个内存中的数据结构,它包含数据结构中目前所有的值,集合中每个元素都得算出来来才能添加到集合中(不管往集合里加东西或者删东西,集合中的每个元素都是放在内存里的,元素都得先算出来才能成为集合的一部分)。
    流则是概念上固定的数据结构,其元素是按需计算的。从另一个角度来说,流就像是一个延迟创建的集合:只有在消费者要求的时候才会计算值。而集合则是急切创建的。

    只能遍历一次

    和迭代器类似,流只能遍历一次。遍历完以后,这个流就已经被消费掉了。可以从原始数据源那里再获得一个新的流来重新遍历一遍。

    以下代码会抛出一个异常,提示流已被消费掉了:

    List<String> title = Arrays.asList("Java8","In","Action");
    Stream<String> s = title.stream();
    s.forEach(System.out::println);
    s.forEach(System.out::println);
    
    外部迭代和内部迭代

    集合和流的另一个关键区别在于它们遍历数据的方式。

    使用Collection接口需要用户去做迭代(比如用for-each),这称为外部迭代。而Stream库使用内部迭代 ----- 它帮你把迭代做了,还把得到的流值存在了某个地方,只要给出一个函数说要干什么就可以了。

    用for-each循环外部迭代:

    List<String> names = new ArrayList<>();
    for(Dish d: menu){
        names.add(d.getName());
    }
    

    用背后的迭代器做外部迭代:

    List<String> names = new ArrayList<>();
    Iterator<String> iterator =menu.iterator();
    while(iterator.hasNext()) {
        Dish d = iterator.next();
        names.add(d.getName());
    }
    

    流:内部迭代:

    List <String> names = menu.stream()
               .map(Dish::getName)
               .collect(toList());
    

    流操作

    java.util.stream.Stream中的stream接口定义了许多操作。它们可以被分为两大类:中间操作终端操作。可以被连接起来的流操作称为中间操作,关闭流的操作称为终端操作

    中间操作

    中间操作会返回另一个流。这让多个操作可以连接起来形成一个查询。更重要的是,除非流水线上触发一个终端操作,否则中间操作不会执行任何处理。中间操作会合并起来在终端操作时一次性全部处理。

    终端操作

    终端操作会从流的流水线生成结果。其结果可以是任何不是流的值。

    使用流

    流的使用一般包括三件事:

    • 一个数据源来执行一个查询;
    • 一个中间操作链,形成一条流的流水线;
    • 一个终端操作,执行流水线并生成结果。

    流的流水线背后的理念类似于构建器模式。在构建器模式中有一个调用链用来设置一套配置(流的中间操作链),接着是调用built方法(流的终端操作)。

    相关文章

      网友评论

        本文标题:【Java 8实战笔记】引入流

        本文链接:https://www.haomeiwen.com/subject/npfcyxtx.html