流简介
1.流是什么?
流到底是什么呢?简短的定义就是“ 从支持数据处理操作的源生成的元素序列 ”
- 元素序列:就像集合一样,流也提供了一个接口,可以访问特定元素类型的一组有序值。但流的目的在于表达计算,比如filter、sorted和map。集合讲的事数据,流讲的是计算。
- 源:流会使用一个提供数据的源,如集合、数组或者输入/输出资源。
- 数据处理操作:流的数据处理功能支持类似于数据库的操作,以及函数式编程语言中的常用操作,如filter、map、reduce、find、match、sort等。流操作可以顺序执行,也可以并行执行。
流操作两个重要的特点:
- 流水线:很多流操作本身会返回一个流,这样多个操作就可以链接起来,形成一个大的流水线。
- 内部迭代:与使用迭代器显示迭代的集合不同,流的迭代操作是在背后进行的。
2.流与集合
流与集合之间的差异在于什么时候进行计算。
集合是一个内存中的数据结构,它包含数据结构中目前所有的值——集合中的每个元素都得先算出来才能添加到集合中。(集合中的每个元素都是放在内存里的,元素都得先算出来才能成为集合的一部分。)
流是在概念上固定的数据结构(你不能添加或删除元素),其元素则是按需计算的。(流就像是一个延迟创建的集合:只有在消费者要求的时候才会计算值。)
2.1 流只能遍历一次
==和迭代器类似,流只能遍历一次。遍历完之后,我们就说这个流已经被消费掉了。==
就比如下面这段代码:
List<String> title = Arrays.asList("Java8","In","Action");
Stream<String> s = title.stream();
s.forEach(System.out::println);
//到这里就会报出异常:流已被操作或者关闭
s.forEach(System.out::println);
3. 外部迭代与内部迭代
使用Collection接口需要用户去做迭代(比如用for-each),这称为外部迭代。相反,Streams库使用内部迭代——它帮你把迭代做了,还把得到的流值存在了某个地方,你只要给出一个函数说要干什么就可以了。
3.1 使用内部迭代的原因
内部迭代时,项目可以透明的并行处理,或者用更优化的顺序进行处理。
Streams库的内部迭代可以自动选择一种适合硬件的数据表示和并行实现。与此相反,一旦通过写for-each而选择了外部迭代,那你基本上就要自己管理所有的并行问题了(自己管理实际上意味着“某个良辰吉日我们会把它并行化”或者“开始了关于人物和synchronized的漫长二而艰苦的斗争”。)
差异对比.png4. 流操作
可以连接起来的流操作称为中间操作,关闭流的操作称为终端操作。
4.1 中间操作
诸如filter或sorted等中间操作会返回另一个流。折让多个操作可以链接起来形成一个查询。重要的是,==除非流水线上出发一个终端操作,否则中间操作不会执行任何处理——它们很懒。==
4.2 终端操作
终端操作会从流的流水线生成结果。其结果是任何不是流的值,比如List、Integer,甚至是void。
4.3 使用流
总而言之,流的使用一般包括三件事:
- 一个数据源(如集合)来执行一个查询;
- 一个中间操作链,形成一条流的流水线;
- 一个终端操作,执行流水线,并能生成结果;
中间操作:
操作 | 类型 | 返回类型 | 操作参数 | 函数描述符 |
---|---|---|---|---|
filter | 中间 | Stream<T> | Predicate<T> | T -> boolean |
map | 中间 | Stream<R> | Funcation<T,R> | T -> R |
limit | 中间 | Stream<T> | ||
sorted | 中间 | Stream<T> | Comparator<T> | (T,T) -> int |
distinct | 中间 | Stream<T> |
终端操作:
操作 | 类型 | 目的 |
---|---|---|
forEach | 终端 | 消费流中的每个元素并对其应用Lambda。这一操作返回void |
count | 终端 | 返回流中元素的个数。这一操作返回long |
collect | 终端 | 把流归约成一个集合,比如List、Map甚至是Integer。 |
小结
- 流是“ 从支持数据处理操作的源生成的一系列元素 ”。
- 流利用内部迭代:迭代通过filter、map、sorted等操作被抽象掉了。
- 流操作有两类:中间操作和终端操作(也就终止操作)。
- filter和map等中间操作会返回一个流,并可以链接在一起。可以把它们设置成一条流水线,但并不会生成任何结果。
- forEach和count等终端操作会返回一个非流的值,并处理流水线以返回结果。
- 流中的元素是按需计算的。
使用流
1. 筛选和切片
1.1 谓词筛选
Stream接口支持filter方法。该操作会接收一个谓词(一个返回boolean的函数)作为参数,并返回一个包括所有符合谓词的元素的流
代码示例:
List<Dish> vegetarianMenu = menu.stream().filter(Dish::isVegetarian).collect(toList());
1.2 筛选各异元素(去重)
==使用distinct()
方法。==
1.3 截短流
流支持==limit(n)==方法,该方法会返回一个不超过给定长度的流。所需的长度做为参数传递给limit。如果流是有序的,则最多会返回前n个元素。
1.4 跳过元素
流支持==skip(n)==方法,该方法会返回一个扔4
掉前n个元素的流。如果流中元素不足n个,则返回一个空值。
2. 映射
map
流支持map方法,它会接收一个函数做为参数。这个函数会被应用到每个元素上,并将其映射成一个新的元素 (使用映射一次,是因为它和转换类似,但其中的细微差别在于它是“创建一个新版本”而不是去“修改”)。
flatMap
流支持flatMap方法,它的效果是,把一个流中的每个值都换成另一个流,然后把所有的流连接起来成为一个流。
3.查找和匹配
3.1 检查谓词是否至少匹配一个元素
使用==anyMatch==方法。anyMatch方法返回一个boolean,因此是一个终端操作。
3.2 检查谓词是否匹配所有元素
使用==allMatch==方法。它的工作原理和anyMatch类似,但它会看看流中的元素是否都能匹配给定的谓词。
其中和allMatch相对的是==noneMatch==。它可以确保流中没有任何元素与给定的谓词匹配。
==注意:anyMatch、allMatch和noneMatch这三个操作都用到了我们所谓的短路,这就是大家熟悉的Java中&&和||运算符短路在流中的版本。==
短路求值:
对于流而言,某些操作(例如allMatch、anyMatch、noneMatch、findFirst和findAny)不用处理整个流就能得到结果。只要找到一个元素,就可以有结果了。同样,limit也是一个短路操作:它只需要创建一个给定大小的流,而用不着处理流中所有的元素。在碰到无限大小的流的时候,这种操作就有用了:它们可以把无限流变成有限流。
3.3 查找元素
==findAny==方法将返回当前流中的任意元素。
其中这里涉及到Optional函数,以下为Optional简介:
Optional<T>类(java.util.Optional)是一个容器类,代表一个值存在或不存在。findAny有时候可能什么元素都没找到。Java8的库设计人员引入了Optional<T>,这样就不用返回众所周知容易出问题的null了。
Optional常用检查方法说明:
- isPresent()将在Optional包含值的时候返回true,否则返回false。
- ifPresent(Consumer<T> block)会在值存在的时候执行给定的代码块。
- T get()会在只存在时返回值,否则抛出一个NoSuchElement异常。
- T orElse(T other)会在值存在时返回值,否则返回一个默认值。
4. 到目前为止所学习的中间操作和终端操作记录
操作 | 类型 | 返回类型 | 操作参数 | 函数描述符 |
---|---|---|---|---|
filter | 中间 | Stream<T> | Predicate<T> | T -> boolean |
map | 中间 | Stream<R> | Funcation<T,R> | T -> R |
limit | 中间(有状态-有界) | Stream<T> | ||
sorted | 中间 | Stream<T> | Comparator<T> | (T,T) -> int |
distinct | 中间(有状态-无界) | Stream<T> | ||
skip | 中间(有状态-有界) | Stream<T> | long | |
flatMap | 中间 | Stream<R> | Funcation<T,Stream<R>> | T -> boolean |
anyMatch | 终端 | boolean | Predicate<T> | T -> boolean |
noneMatch | 终端 | boolean | Predicate<T> | T -> boolean |
allMatch | 终端 | boolean | Predicate<T> | T -> boolean |
findAny | 终端 | Optional<T> | ||
findFirst | 终端 | Optional<T> | ||
forEach | 终端 | void | Consumer<T> | T -> void |
collect | 终端 | R | Collector<T,A,R> | |
reduce | 终端(有状态-有界) | Optional<T> | BinaryOperator | (T,T) -> T |
count | 终端 | long |
网友评论