函數式程式設計 Stream 接口真的有那麼好用嗎？

你可能沒意識到Java對函數式程式設計的重視程度，看看Java 8加入函數式程式設計擴充多少功能就清楚了。Java 8之是以費這麼大功夫引入函數式程式設計，原因有二：

代碼簡潔函數式程式設計寫出的代碼簡潔且意圖明确，使用stream接口讓你從此告别for循環。
多核友好，Java函數式程式設計使得編寫并行程式從未如此簡單，你需要的全部就是調用一下 parallel() 方法。

今天主要分享stream，也就是Java函數式程式設計的主角。對于Java 7來說stream完全是個陌生東西，stream并不是某種資料結構，它隻是資料源的一種視圖。這裡的資料源可以是一個數組，Java容器或I/O channel等。正因如此要得到一個stream通常不會手動建立，而是調用對應的工具方法，比如：

調用 Collection.stream() 或者 Collection.parallelStream() 方法
調用 Arrays.stream(T[] array) 方法

常見的stream接口繼承關系如圖：

stream接口繼承自

BaseStream

，其中

IntStream, LongStream, DoubleStream

對應三種基本類型（

int, long, double

，注意不是包裝類型），

Stream

對應所有剩餘類型的stream視圖。為不同資料類型設定不同stream接口，可以

提高性能，
增加特定接口函數

你可能會奇怪為什麼不把

IntStream

等設計成

Stream

的子接口？畢竟這接口中的方法名大部分是一樣的。答案是這些方法的名字雖然相同，但是傳回類型不同，如果設計成父子接口關系，這些方法将不能共存，因為Java不允許隻有傳回類型不同的方法重載。

雖然大部分情況下stream是容器調用

Collection.stream()

方法得到的，但stream和collections有以下不同：

無存儲。stream不是一種資料結構，它隻是某種資料源的一個視圖，資料源可以是一個數組，Java容器或I/O channel等。
為函數式程式設計而生。對stream的任何修改都不會修改背後的資料源，比如對stream執行過濾操作并不會删除被過濾的元素，而是會産生一個不包含被過濾元素的新stream。
惰式執行。stream上的操作并不會立即執行，隻有等到使用者真正需要結果的時候才會執行。
可消費性。stream隻能被“消費”一次，一旦周遊過就會失效，就像容器的疊代器那樣，想要再次周遊必須重新生成。

對stream的操作分為為兩類，中間操作(intermediate operations)和結束操作(terminal operations)，二者特點是：

中間操作總是會惰式執行，調用中間操作隻會生成一個标記了該操作的新stream，僅此而已。
結束操作會觸發實際計算，計算發生時會把所有中間操作積攢的操作以pipeline的方式執行，這樣可以減少疊代次數。計算完成之後stream就會失效。

如果你熟悉Apache Spark RDD，對stream的這個特點應該不陌生。

下表彙總了

Stream

接口的部分常見方法：

區分中間操作和結束操作最簡單的方法，就是看方法的傳回值，傳回值為stream的大都是中間操作，否則是結束操作。

stream方法使用

stream跟函數接口關系非常緊密，沒有函數接口stream就無法工作。回顧一下：函數接口是指内部隻有一個抽象方法的接口。通常函數接口出現的地方都可以使用Lambda表達式，是以不必記憶函數接口的名字。

我們對

forEach()

方法并不陌生，在

Collection

中我們已經見過。方法簽名為

void forEach(Consumer<? super E> action)

，作用是對容器中的每個元素執行

action

指定的動作，也就是對元素進行周遊。

由于

forEach()

是結束方法，上述代碼會立即執行，輸出所有字元串。

filter()

函數原型為

Stream<T> filter(Predicate<? super T> predicate)

，作用是傳回一個隻包含滿足

predicate

條件元素的

Stream

。

上述代碼将輸出為長度等于3的字元串

you

和

too

。注意，由于

filter()

是個中間操作，如果隻調用

filter()

不會有實際計算，是以也不會輸出任何資訊。

distinct()

函數原型為

Stream<T> distinct()

，作用是傳回一個去除重複元素之後的

Stream

。

sorted()

排序函數有兩個，一個是用自然順序排序，一個是使用自定義比較器排序，函數原型分别為

Stream<T>　sorted()

和

Stream<T>　sorted(Comparator<? super T> comparator)

。

map()

函數原型為

<R> Stream<R> map(Function<? super T,? extends R> mapper)

，作用是傳回一個對目前所有元素執行執行

mapper

之後的結果組成的

Stream

。直覺的說，就是對每個元素按照某種操作進行轉換，轉換前後

Stream

中元素的個數不會改變，但元素的類型取決于轉換之後的類型。

上述代碼将輸出原字元串的大寫形式。

flatMap()

函數原型為

<R> Stream<R> flatMap(Function<? super T,? extends Stream<? extends R>> mapper)

，作用是對每個元素執行

mapper

指定的操作，并用所有

mapper

傳回的

Stream

中的元素組成一個新的

Stream

作為最終傳回結果。說起來太拗口，通俗的講

flatMap()

的作用就相當于把原stream中的所有元素都"攤平"之後組成的

Stream

，轉換前後元素的個數和類型都可能會改變。

上述代碼中，原來的

stream

中有兩個元素，分别是兩個

List<Integer>

，執行

flatMap()

之後，将每個

List

都“攤平”成了一個個的數字，是以會新産生一個由5個數字組成的

Stream

。是以最終将輸出1~5這5個數字。