函数式编程 Stream 接口真的有那么好用吗?
你可能没意识到 Java 对函数式编程的重视程度,看看 Java 8 加入函数式编程扩充多少功能就清楚了。Java 8 之所以费这么大功夫引入函数式编程,原因有二:
代码简洁函数式编程写出的代码简洁且意图明确,使用 stream 接口让你从此告别 for 循环。
多核友好,Java 函数式编程使得编写并行程序从未如此简单,你需要的全部就是调用一下
parallel()
方法。
今天主要分享 stream,也就是 Java 函数式编程的主角。对于 Java 7 来说 stream 完全是个陌生东西,stream 并不是某种数据结构,它只是数据源的一种视图。这里的数据源可以是一个数组,Java 容器或 I/O channel 等。正因如此要得到一个 stream 通常不会手动创建,而是调用对应的工具方法,比如:
调用
Collection.stream()
或者Collection.parallelStream()
方法调用
Arrays.stream(T[] array)
方法
常见的 stream 接口继承关系如图:
stream 接口继承自BaseStream
,其中IntStream, LongStream, DoubleStream
对应三种基本类型(int, long, double
,注意不是包装类型),Stream
对应所有剩余类型的 stream 视图。为不同数据类型设置不同 stream 接口,可以
提高性能,
增加特定接口函数
你可能会奇怪为什么不把IntStream
等设计成Stream
的子接口?毕竟这接口中的方法名大部分是一样的。答案是这些方法的名字虽然相同,但是返回类型不同,如果设计成父子接口关系,这些方法将不能共存,因为 Java 不允许只有返回类型不同的方法重载。
虽然大部分情况下 stream 是容器调用Collection.stream()
方法得到的,但 stream 和 collections 有以下不同:
无存储。stream 不是一种数据结构,它只是某种数据源的一个视图,数据源可以是一个数组,Java 容器或 I/O channel 等。
为函数式编程而生。对 stream 的任何修改都不会修改背后的数据源,比如对 stream 执行过滤操作并不会删除被过滤的元素,而是会产生一个不包含被过滤元素的新 stream。
惰式执行。stream 上的操作并不会立即执行,只有等到用户真正需要结果的时候才会执行。
可消费性。stream 只能被“消费”一次,一旦遍历过就会失效,就像容器的迭代器那样,想要再次遍历必须重新生成。
对 stream 的操作分为为两类,中间操作(intermediate operations)和结束操作(terminal operations),二者特点是:
中间操作总是会惰式执行,调用中间操作只会生成一个标记了该操作的新 stream,仅此而已。
结束操作会触发实际计算,计算发生时会把所有中间操作积攒的操作以 pipeline 的方式执行,这样可以减少迭代次数。计算完成之后 stream 就会失效。
如果你熟悉 Apache Spark RDD,对 stream 的这个特点应该不陌生。
下表汇总了Stream
接口的部分常见方法:
区分中间操作和结束操作最简单的方法,就是看方法的返回值,返回值为 stream 的大都是中间操作,否则是结束操作。
stream 方法使用
stream 跟函数接口关系非常紧密,没有函数接口 stream 就无法工作。回顾一下:函数接口是指内部只有一个抽象方法的接口。通常函数接口出现的地方都可以使用 Lambda 表达式,所以不必记忆函数接口的名字。
我们对forEach()
方法并不陌生,在Collection
中我们已经见过。方法签名为void forEach(Consumer<? super E> action)
,作用是对容器中的每个元素执行action
指定的动作,也就是对元素进行遍历。
由于forEach()
是结束方法,上述代码会立即执行,输出所有字符串。
filter()
函数原型为Stream<T> filter(Predicate<? super T> predicate)
,作用是返回一个只包含满足predicate
条件元素的Stream
。
上述代码将输出为长度等于 3 的字符串you
和too
。注意,由于filter()
是个中间操作,如果只调用filter()
不会有实际计算,因此也不会输出任何信息。
distinct()
函数原型为Stream<T> distinct()
,作用是返回一个去除重复元素之后的Stream
。
sorted()
排序函数有两个,一个是用自然顺序排序,一个是使用自定义比较器排序,函数原型分别为Stream<T> sorted()
和Stream<T> sorted(Comparator<? super T> comparator)
。
map()
函数原型为<R> Stream<R> map(Function<? super T,? extends R> mapper)
,作用是返回一个对当前所有元素执行执行mapper
之后的结果组成的Stream
。直观的说,就是对每个元素按照某种操作进行转换,转换前后Stream
中元素的个数不会改变,但元素的类型取决于转换之后的类型。
上述代码将输出原字符串的大写形式。
flatMap()
函数原型为<R> Stream<R> flatMap(Function<? super T,? extends Stream<? extends R>> mapper)
,作用是对每个元素执行mapper
指定的操作,并用所有mapper
返回的Stream
中的元素组成一个新的Stream
作为最终返回结果。说起来太拗口,通俗的讲flatMap()
的作用就相当于把原 stream 中的所有元素都"摊平"之后组成的Stream
,转换前后元素的个数和类型都可能会改变。
上述代码中,原来的stream
中有两个元素,分别是两个List<Integer>
,执行flatMap()
之后,将每个List
都“摊平”成了一个个的数字,所以会新产生一个由 5 个数字组成的Stream
。所以最终将输出 1~5 这 5 个数字。
版权声明: 本文为 InfoQ 作者【码农架构】的原创文章。
原文链接:【http://xie.infoq.cn/article/06c2ad4a0e3cf77eda5b70045】。文章转载请联系作者。
评论