你可能沒意識到Java對函數式程式設計的重視程度,看看Java 8加入函數式程式設計擴充多少功能就清楚了。Java 8之是以費這麼大功夫引入函數式程式設計,原因有二:
- 代碼簡潔函數式程式設計寫出的代碼簡潔且意圖明确,使用stream接口讓你從此告别for循環。
- 多核友好,Java函數式程式設計使得編寫并行程式從未如此簡單,你需要的全部就是調用一下
方法。parallel()
今天主要分享stream,也就是Java函數式程式設計的主角。對于Java 7來說stream完全是個陌生東西,stream并不是某種資料結構,它隻是資料源的一種視圖。這裡的資料源可以是一個數組,Java容器或I/O channel等。正因如此要得到一個stream通常不會手動建立,而是調用對應的工具方法,比如:
- 調用
或者Collection.stream()
方法Collection.parallelStream()
- 調用
方法Arrays.stream(T[] array)
常見的stream接口繼承關系如圖:
stream接口繼承自
BaseStream
,其中
IntStream, LongStream, DoubleStream
對應三種基本類型(
int, long, double
,注意不是包裝類型),
Stream
對應所有剩餘類型的stream視圖。為不同資料類型設定不同stream接口,可以
- 提高性能,
- 增加特定接口函數
你可能會奇怪為什麼不把
IntStream
等設計成
Stream
的子接口?畢竟這接口中的方法名大部分是一樣的。答案是這些方法的名字雖然相同,但是傳回類型不同,如果設計成父子接口關系,這些方法将不能共存,因為Java不允許隻有傳回類型不同的方法重載。
雖然大部分情況下stream是容器調用
Collection.stream()
方法得到的,但stream和collections有以下不同:
- 無存儲。stream不是一種資料結構,它隻是某種資料源的一個視圖,資料源可以是一個數組,Java容器或I/O channel等。
- 為函數式程式設計而生。對stream的任何修改都不會修改背後的資料源,比如對stream執行過濾操作并不會删除被過濾的元素,而是會産生一個不包含被過濾元素的新stream。
- 惰式執行。stream上的操作并不會立即執行,隻有等到使用者真正需要結果的時候才會執行。
- 可消費性。stream隻能被“消費”一次,一旦周遊過就會失效,就像容器的疊代器那樣,想要再次周遊必須重新生成。
對stream的操作分為為兩類,中間操作(intermediate operations)和結束操作(terminal operations),二者特點是:
- 中間操作總是會惰式執行,調用中間操作隻會生成一個标記了該操作的新stream,僅此而已。
- 結束操作會觸發實際計算,計算發生時會把所有中間操作積攢的操作以pipeline的方式執行,這樣可以減少疊代次數。計算完成之後stream就會失效。
如果你熟悉Apache Spark RDD,對stream的這個特點應該不陌生。
下表彙總了
Stream
接口的部分常見方法:
區分中間操作和結束操作最簡單的方法,就是看方法的傳回值,傳回值為stream的大都是中間操作,否則是結束操作。
stream方法使用
stream跟函數接口關系非常緊密,沒有函數接口stream就無法工作。回顧一下:函數接口是指内部隻有一個抽象方法的接口。通常函數接口出現的地方都可以使用Lambda表達式,是以不必記憶函數接口的名字。
我們對
forEach()
方法并不陌生,在
Collection
中我們已經見過。方法簽名為
void forEach(Consumer<? super E> action)
,作用是對容器中的每個元素執行
action
指定的動作,也就是對元素進行周遊。
由于
forEach()
是結束方法,上述代碼會立即執行,輸出所有字元串。
filter()
函數原型為
Stream<T> filter(Predicate<? super T> predicate)
,作用是傳回一個隻包含滿足
predicate
條件元素的
Stream
。
上述代碼将輸出為長度等于3的字元串
you
和
too
。注意,由于
filter()
是個中間操作,如果隻調用
filter()
不會有實際計算,是以也不會輸出任何資訊。
distinct()
函數原型為
Stream<T> distinct()
,作用是傳回一個去除重複元素之後的
Stream
。
sorted()
排序函數有兩個,一個是用自然順序排序,一個是使用自定義比較器排序,函數原型分别為
Stream<T> sorted()
和
Stream<T> sorted(Comparator<? super T> comparator)
。
map()
函數原型為
<R> Stream<R> map(Function<? super T,? extends R> mapper)
,作用是傳回一個對目前所有元素執行執行
mapper
之後的結果組成的
Stream
。直覺的說,就是對每個元素按照某種操作進行轉換,轉換前後
Stream
中元素的個數不會改變,但元素的類型取決于轉換之後的類型。
上述代碼将輸出原字元串的大寫形式。
flatMap()
函數原型為
<R> Stream<R> flatMap(Function<? super T,? extends Stream<? extends R>> mapper)
,作用是對每個元素執行
mapper
指定的操作,并用所有
mapper
傳回的
Stream
中的元素組成一個新的
Stream
作為最終傳回結果。說起來太拗口,通俗的講
flatMap()
的作用就相當于把原stream中的所有元素都"攤平"之後組成的
Stream
,轉換前後元素的個數和類型都可能會改變。
上述代碼中,原來的
stream
中有兩個元素,分别是兩個
List<Integer>
,執行
flatMap()
之後,将每個
List
都“攤平”成了一個個的數字,是以會新産生一個由5個數字組成的
Stream
。是以最終将輸出1~5這5個數字。