天天看点

Java8初体验(二)Stream语法详解1. Stream初体验2. 创建Stream3. 转换Stream4. 汇聚(Reduce)Stream5. 下期预告6. 引用文档

感谢同事【天锦】的投稿。投稿请联系 [email protected]

我们先来看看java里面是怎么定义stream的:

a sequence of elements supporting sequential and parallel aggregate operations.

我们来解读一下上面的那句话:

stream是元素的集合,这点让stream看起来用些类似iterator;

可以支持顺序和并行的对原stream进行汇聚的操作;

大家可以把stream当成一个高级版本的iterator。原始版本的iterator,用户只能一个一个的遍历元素并对其执行某些操作;高级版本的stream,用户只要给出需要对其包含的元素执行什么操作,比如“过滤掉长度大于10的字符串”、“获取每个字符串的首字母”等,具体这些操作如何应用到每个元素上,就给stream就好了!(这个秘籍,一般人我不告诉他:))大家看完这些可能对stream还没有一个直观的认识,莫急,咱们来段代码。

上面这段代码是获取一个list中,元素不为null的个数。这段代码虽然很简短,但是却是一个很好的入门级别的例子来体现如何使用stream,正所谓“麻雀虽小五脏俱全”。我们现在开始深入解刨这个例子,完成以后你可能可以基本掌握stream的用法!

Java8初体验(二)Stream语法详解1. Stream初体验2. 创建Stream3. 转换Stream4. 汇聚(Reduce)Stream5. 下期预告6. 引用文档

图片就是对于stream例子的一个解析,可以很清楚的看见:原本一条语句被三种颜色的框分割成了三个部分。红色框中的语句是一个stream的生命开始的地方,负责创建一个stream实例;绿色框中的语句是赋予stream灵魂的地方,把一个stream转换成另外一个stream,红框的语句生成的是一个包含所有nums变量的stream,进过绿框的filter方法以后,重新生成了一个过滤掉原nums列表所有null以后的stream;蓝色框中的语句是丰收的地方,把stream的里面包含的内容按照某种算法来汇聚成一个值,例子中是获取stream中包含的元素个数。如果这样解析以后,还不理解,那就只能动用“核武器”–图形化,一图抵千言!

Java8初体验(二)Stream语法详解1. Stream初体验2. 创建Stream3. 转换Stream4. 汇聚(Reduce)Stream5. 下期预告6. 引用文档

在此我们总结一下使用stream的基本步骤:

创建stream;

转换stream,每次转换原有stream对象不改变,返回一个新的stream对象(**可以有多次转换**);

对stream进行聚合(reduce)操作,获取想要的结果;

最常用的创建stream有两种途径:

通过stream接口的静态工厂方法(注意:java8里接口可以带静态方法);

通过collection接口的默认方法(默认方法:default method,也是java8中的一个新特性,就是接口中的一个带有实现的方法,后续文章会有介绍)–stream(),把一个collection对象转换成stream

1. of方法:有两个overload方法,一个接受变长参数,一个接口单一值

2. generator方法:生成一个无限长度的stream,其元素的生成是通过给定的supplier(这个接口可以看成一个对象的工厂,每次调用返回一个给定类型的对象)

三条语句的作用都是一样的,只是使用了lambda表达式和方法引用的语法来简化代码。每条语句其实都是生成一个无限长度的stream,其中值是随机的。这个无限长度stream是懒加载,一般这种无限长度的stream都会配合stream的limit()方法来用。

3. iterate方法:也是生成无限长度的stream,和generator不同的是,其元素的生成是重复对给定的种子值(seed)调用用户指定函数来生成的。其中包含的元素可以认为是:seed,f(seed),f(f(seed))无限循环

这段代码就是先获取一个无限长度的正整数集合的stream,然后取出前10个打印。千万记住使用limit方法,不然会无限打印下去。

这个在本文的第一个例子中就展示了从list对象获取其对应的stream对象,如果查看java doc就可以发现collection接口有一个stream方法,所以其所有子类都都可以获取对应的stream对象。

转换stream其实就是把一个stream通过某些行为转换成一个新的stream。stream接口中定义了几个常用的转换方法,下面我们挑选几个常用的转换方法来解释。

1. distinct: 对于stream中包含的元素进行去重操作(去重逻辑依赖元素的equals方法),新生成的stream中没有重复的元素;

distinct方法示意图(**以下所有的示意图都要感谢[rxjava](https://github.com/netflix/rxjava)项目的doc中的图片给予的灵感, 如果示意图表达的有错误和不准确的地方,请直接联系我。**):

Java8初体验(二)Stream语法详解1. Stream初体验2. 创建Stream3. 转换Stream4. 汇聚(Reduce)Stream5. 下期预告6. 引用文档

2. filter: 对于stream中包含的元素使用给定的过滤函数进行过滤操作,新生成的stream只包含符合条件的元素;

filter方法示意图:

Java8初体验(二)Stream语法详解1. Stream初体验2. 创建Stream3. 转换Stream4. 汇聚(Reduce)Stream5. 下期预告6. 引用文档

3. map: 对于stream中包含的元素使用给定的转换函数进行转换操作,新生成的stream只包含转换生成的元素。这个方法有三个对于原始类型的变种方法,分别是:maptoint,maptolong和maptodouble。这三个方法也比较好理解,比如maptoint就是把原始stream转换成一个新的stream,这个新生成的stream中的元素都是int类型。之所以会有这样三个变种方法,可以免除自动装箱/拆箱的额外消耗;

map方法示意图:

Java8初体验(二)Stream语法详解1. Stream初体验2. 创建Stream3. 转换Stream4. 汇聚(Reduce)Stream5. 下期预告6. 引用文档

4. flatmap:和map类似,不同的是其每个元素转换得到的是stream对象,会把子stream中的元素压缩到父集合中;

flatmap方法示意图:

Java8初体验(二)Stream语法详解1. Stream初体验2. 创建Stream3. 转换Stream4. 汇聚(Reduce)Stream5. 下期预告6. 引用文档

5. peek: 生成一个包含原stream的所有元素的新stream,同时会提供一个消费函数(consumer实例),新stream每个元素被消费的时候都会执行给定的消费函数;

peek方法示意图:

Java8初体验(二)Stream语法详解1. Stream初体验2. 创建Stream3. 转换Stream4. 汇聚(Reduce)Stream5. 下期预告6. 引用文档

6. limit: 对一个stream进行截断操作,获取其前n个元素,如果原stream中包含的元素个数小于n,那就获取其所有的元素;

limit方法示意图:

Java8初体验(二)Stream语法详解1. Stream初体验2. 创建Stream3. 转换Stream4. 汇聚(Reduce)Stream5. 下期预告6. 引用文档

7. skip: 返回一个丢弃原stream的前n个元素后剩下元素组成的新stream,如果原stream中包含的元素个数小于n,那么返回空stream;

skip方法示意图:

Java8初体验(二)Stream语法详解1. Stream初体验2. 创建Stream3. 转换Stream4. 汇聚(Reduce)Stream5. 下期预告6. 引用文档

8. 在一起,在一起!

这段代码演示了上面介绍的所有转换方法(除了flatmap),简单解释一下这段代码的含义:给定一个integer类型的list,获取其对应的stream对象,然后进行过滤掉null,再去重,再每个元素乘以2,再每个元素被消费的时候打印自身,在跳过前两个元素,最后去前四个元素进行加和运算(解释一大堆,很像废话,因为基本看了方法名就知道要做什么了。这个就是声明式编程的一大好处!)。大家可以参考上面对于每个方法的解释,看看最终的输出是什么。

9. 性能问题

有些细心的同学可能会有这样的疑问:在对于一个stream进行多次转换操作,每次都对stream的每个元素进行转换,而且是执行多次,这样时间复杂度就是一个for循环里把所有操作都做掉的n(转换的次数)倍啊。其实不是这样的,转换操作都是lazy的,多个转换操作只会在汇聚操作(见下节)的时候融合起来,一次循环完成。我们可以这样简单的理解,stream里有个操作函数的集合,每次转换操作就是把转换函数放入这个集合中,在汇聚操作的时候循环stream对应的集合,然后对每个元素执行所有的函数。

汇聚这个词,是我自己翻译的,如果大家有更好的翻译,可以在下面留言。在官方文档中是reduce,也叫fold。

在介绍汇聚操作之前,我们先看一下java doc中对于其定义:

a reduction operation (also called a fold) takes a sequence of input elements and combines them into a single summary result by repeated application of a combining operation, such as finding the sum or maximum of a set of numbers, or accumulating elements into a list. the streams classes have multiple forms of general reduction operations, called reduce() and collect(), as well as multiple specialized reduction forms such as sum(), max(), or count().

简单翻译一下:汇聚操作(也称为折叠)接受一个元素序列为输入,反复使用某个合并操作,把序列中的元素合并成一个汇总的结果。比如查找一个数字列表的总和或者最大值,或者把这些数字累积成一个list对象。stream接口有一些通用的汇聚操作,比如reduce()和collect();也有一些特定用途的汇聚操作,比如sum(),max()和count()。注意:sum方法不是所有的stream对象都有的,只有intstream、longstream和doublestream是实例才有。

下面会分两部分来介绍汇聚操作:

可变汇聚:把输入的元素们累积到一个可变的容器中,比如collection或者stringbuilder;

其他汇聚:除去可变汇聚剩下的,一般都不是通过反复修改某个可变对象,而是通过把前一次的汇聚结果当成下一次的入参,反复如此。比如reduce,count,allmatch;

可变汇聚对应的只有一个方法:collect,正如其名字显示的,它可以把stream中的要有元素收集到一个结果容器中(比如collection)。先看一下最通用的collect方法的定义(还有其他override方法):

先来看看这三个参数的含义:supplier supplier是一个工厂函数,用来生成一个新的容器;biconsumer accumulator也是一个函数,用来把stream中的元素添加到结果容器中;biconsumer combiner还是一个函数,用来把中间状态的多个结果容器合并成为一个(并发的时候会用到)。看晕了?来段代码!

上面这段代码就是对一个元素是integer类型的list,先过滤掉全部的null,然后把剩下的元素收集到一个新的list中。进一步看一下collect方法的三个参数,都是lambda形式的函数(*上面的代码可以使用方法引用来简化,留给读者自己去思考*)。

第一个函数生成一个新的arraylist实例;

第二个函数接受两个参数,第一个是前面生成的arraylist对象,二个是stream中包含的元素,函数体就是把stream中的元素加入arraylist对象中。第二个函数被反复调用直到原stream的元素被消费完毕;

第三个函数也是接受两个参数,这两个都是arraylist类型的,函数体就是把第二个arraylist全部加入到第一个中;

但是上面的collect方法调用也有点太复杂了,没关系!我们来看一下collect方法另外一个override的版本,其依赖[collector](http://docs.oracle.com/javase/8/docs/api/java/util/stream/collector.html)。

这样清爽多了!少年,还有好消息,java8还给我们提供了collector的工具类–[collectors](http://docs.oracle.com/javase/8/docs/api/java/util/stream/collectors.html),其中已经定义了一些静态工厂方法,比如:collectors.tocollection()收集到collection中, collectors.tolist()收集到list中和collectors.toset()收集到set中。这样的静态方法还有很多,这里就不一一介绍了,大家可以直接去看javadoc。下面看看使用collectors对于代码的简化:

– reduce方法:reduce方法非常的通用,后面介绍的count,sum等都可以使用其实现。reduce方法有三个override的方法,本文介绍两个最常用的,最后一个留给读者自己学习。先来看reduce方法的第一种形式,其方法定义如下:

接受一个binaryoperator类型的参数,在使用的时候我们可以用lambda表达式来。

可以看到reduce方法接受一个函数,这个函数有两个参数,第一个参数是上次函数执行的返回值(也称为中间结果),第二个参数是stream中的元素,这个函数把这两个值相加,得到的和会被赋值给下次执行这个函数的第一个参数。要注意的是:**第一次执行的时候第一个参数的值是stream的第一个元素,第二个参数是stream的第二个元素**。这个方法返回值类型是optional,这是java8防止出现npe的一种可行方法,后面的文章会详细介绍,这里就简单的认为是一个容器,其中可能会包含0个或者1个对象。

这个过程可视化的结果如图:

Java8初体验(二)Stream语法详解1. Stream初体验2. 创建Stream3. 转换Stream4. 汇聚(Reduce)Stream5. 下期预告6. 引用文档

reduce方法还有一个很常用的变种:

这个定义上上面已经介绍过的基本一致,不同的是:它允许用户提供一个循环计算的初始值,如果stream为空,就直接返回该值。而且这个方法不会返回optional,因为其不会出现null值。下面直接给出例子,就不再做说明了。

– count方法:获取stream中元素的个数。比较简单,这里就直接给出例子,不做解释了。

– 搜索相关

– allmatch:是不是stream中的所有元素都满足给定的匹配条件

– anymatch:stream中是否存在任何一个元素满足匹配条件

– findfirst: 返回stream中的第一个元素,如果stream为空,返回空optional

– nonematch:是不是stream中的所有元素都不满足给定的匹配条件

– max和min:使用给定的比较器(operator),返回stream中的最大|最小值

下面给出allmatch和max的例子,剩下的方法读者当成练习。

functional interface

1. 《java se 8 for the really impatient》

2. java 8 api doc