天天看點

java容器周遊_高效周遊Java容器

Java 程式員經常使用容器,比如 ArrayList 和 HashSet。Java 8 中的 lambda 文法和 steaming API 可以讓我們更友善的使用容器。大部分情況下,我們僅僅處理幾千個元素,也不會去考慮性能問題。但是,在一些極端場景下,如果我們需要周遊上百萬個元素,性能問題就凸顯出來了。

本文将采用 JMH 計算每塊代碼的運作時間。

forEach vs. C Style vs. Stream API

周遊是一個基本的功能。所有程式設計語言都提供了簡單的文法,讓程式員去周遊容器。Steam API 以一種非常直接的形式來周遊容器。

publicList streamSingleThread(BenchMarkState state){

List result =newArrayList<>(state.testData.size());

state.testData.stream().forEach(item -> {

result.add(item);

});

returnresult;

}

publicList streamMultiThread(BenchMarkState state){

List result =newArrayList<>(state.testData.size());

state.testData.stream().parallel().forEach(item -> {

result.add(item);

});

returnresult;

}

forEach 循環也很簡單:

publicListforEach(BenchMarkState state){

List result =newArrayList<>(state.testData.size());

for(Integer item : state.testData){

result.add(item);

}

returnresult;

}

C 語言形式的 for 循環啰嗦一些,不過依然很緊湊:

publicListforCStyle(BenchMarkState state){

intsize = state.testData.size();

List result =newArrayList<>(size);

for(intj =0; j < size; j ++){

result.add(state.testData.get(j));

}

returnresult;

}

以下是性能報告:

Benchmark Mode  Cnt   Score   Error  Units

TestLoopPerformance.forCStyle avgt20018.068±0.074ms/op

TestLoopPerformance.forEach avgt20030.566±0.165ms/op

TestLoopPerformance.streamMultiThread   avgt20079.433±0.747ms/op

TestLoopPerformance.streamSingleThread  avgt20037.779±0.485ms/op

使用 C 語言形式的 for 循環,JVM 每次僅僅增加一個數字,然後直接從記憶體裡讀出資料。這使得它非常迅速。但是 forEach 就大不一樣,根據 StackOverFlow 的這篇回答

(https://stackoverflow.com/questions/85190/how-does-the-java-for-each-loop-work/85206#85206),

和 Oracle 的文章

(https://docs.oracle.com/javase/1.5.0/docs/guide/language/foreach.html),

JVM 需要把 forEach 轉換成一個 iterator,然後每個元素都調用一次 hasNext() 方法。這就是 forEach 比 C 語言的形式慢一些的原因。

哪一個是周遊 Set 最高效的方法呢?

我們先定義測試資料集:

@State(Scope.Benchmark)

publicstaticclassBenchMarkState{

@Setup(Level.Trial)

publicvoiddoSetup(){

for(inti =0; i <500000; i++){

testData.add(Integer.valueOf(i));

}

}

@TearDown(Level.Trial)

publicvoiddoTearDown(){

testData =newHashSet<>(500000);

}

publicSet testData =newHashSet<>(500000);

}

Java 中的 Set 也支援 Steam API 和 forEach 循環。參考之前的測試,如果我們把 Set 轉換成 ArrayList,然後周遊 ArrayList,或許性能會好一些?

publicListforCStyle(BenchMarkState state){

intsize = state.testData.size();

List result =newArrayList<>(size);

Integer[] temp = (Integer[]) state.testData.toArray(newInteger[size]);

for(intj =0; j < size; j ++){

result.add(temp[j]);

}

returnresult;

}

如果把 iterator 和 C 語言形式結合起來呢?

publicListforCStyleWithIteration(BenchMarkState state){

intsize = state.testData.size();

List result =newArrayList<>(size);

Iterator iteration = state.testData.iterator();

for(intj =0; j < size; j ++){

result.add(iteration.next());

}

returnresult;

}

或者,簡單的周遊怎麼樣?

publicListforEach(BenchMarkState state){

List result =newArrayList<>(state.testData.size());

for(Integer item : state.testData) {

result.add(item);

}

returnresult;

}

這個主意不錯,不過它的效率也不高,因為初始化一個新的 ArrayList 同樣需要消耗資源。

Benchmark     Mode  Cnt  Score   Error  Units

TestLoopPerformance.forCStyle     avgt2006.013±0.108ms/op

TestLoopPerformance.forCStyleWithIteration  avgt2004.281±0.049ms/op

TestLoopPerformance.forEach avgt2004.498±0.026ms/op

HashMap (使用 HashMap 的 HashSet) 不是為周遊所有元素設計的。周遊一個 HashMap 最快的方法是把 Iterator 和 C 語言形式結合起來,這樣 JVM 就不會去調用 hasNext()。

為了讓學習變得輕松、高效,今天給大家免費分享一套Java教學資源。幫助大家在成為Java架構師的道路上披荊斬棘。需要資料的歡迎加入學習交流群:9285,05736