天天看點

深入了解Java中的疊代器

疊代器模式:就是提供一種方法對一個容器對象中的各個元素進行通路,而又不暴露該對象容器的内部細節。

概述

  Java集合架構的集合類,我們有時候稱之為容器。容器的種類有很多種,比如ArrayList、LinkedList、HashSet...,每種容器都有自己的特點,ArrayList底層維護的是一個數組;LinkedList是連結清單結構的;HashSet依賴的是哈希表,每種容器都有自己特有的資料結構。

  因為容器的内部結構不同,很多時候可能不知道該怎樣去周遊一個容器中的元素。是以為了使對容器内元素的操作更為簡單,Java引入了疊代器模式! 

  把通路邏輯從不同類型的集合類中抽取出來,進而避免向外部暴露集合的内部結構。

對于數組我們使用的是下标來進行處理的:

1 int array[] = new int[3];    
2 for (int i = 0; i < array.length; i++) {
3     System.out.println(array[i]);
4 }      

對ArrayList的處理

1 List<String> list = new ArrayList<String>();
2        for(int i = 0 ; i < list.size() ;  i++){
3           String string = list.get(i);
4 }      

  對于這兩種方式,我們總是都知道它的内部結構,通路代碼和集合本身是緊密耦合的,無法将通路邏輯從集合類和用戶端代碼中分離出來。不同的集合會對應不同的周遊方法,用戶端代碼無法複用。在實際應用中如何将上面兩個集合整合是相當麻煩的。是以才有Iterator,它總是用同一種邏輯來周遊集合。使得用戶端自身不需要來維護集合的内部結構,所有的内部狀态都由Iterator來維護。用戶端不用直接和集合進行打交道,而是控制Iterator向它發送向前向後的指令,就可以周遊集合。

1.java.util.Iterator

下面讓我們看看Java中的Iterator接口是如何實作的

  在Java中Iterator為一個接口,它隻提供了疊代的基本規則。在JDK中它是這樣定義的:對Collection進行疊代的疊代器。疊代器取代了Java Collection Framework中的Enumeration。疊代器與枚舉有兩點不同:

  1. 疊代器在疊代期間可以從集合中移除元素。

  2. 方法名得到了改進,Enumeration的方法名稱都比較長。

其接口定義如下:

package java.util;
public interface Iterator<E> {
    boolean hasNext();//判斷是否存在下一個對象元素

    E next();//擷取下一個元素

    void remove();//移除元素
}      

2.Iterable

  Java中還提供了一個Iterable接口,Iterable接口實作後的功能是‘傳回’一個疊代器,我們常用的實作了該接口的子接口有:Collection<E>、List<E>、Set<E>等。該接口的iterator()方法傳回一個标準的Iterator實作。實作Iterable接口允許對象成為Foreach語句的目标。就可以通過foreach語句來周遊你的底層序列。

  Iterable接口包含一個能産生Iterator對象的方法,并且Iterable被foreach用來在序列中移動。是以如果建立了實作Iterable接口的類,都可以将它用于foreach中。

Iterable接口的具體實作:

Package java.lang;

import java.util.Iterator;
public interface Iterable<T> {
    Iterator<T> iterator();
}      

使用疊代器周遊集合:

1 public static void main(String[] args) {
 2         List<String> list = new ArrayList<String>();
 3         list.add("張三1");
 4         list.add("張三2");
 5         list.add("張三3");
 6         list.add("張三4");
 7         
 8         List<String> linkList = new LinkedList<String>();
 9         linkList.add("link1");
10         linkList.add("link2");
11         linkList.add("link3");
12         linkList.add("link4");
13         
14         Set<String> set = new HashSet<String>();
15         set.add("set1");
16         set.add("set2");
17         set.add("set3");
18         set.add("set4");
19         //使用疊代器周遊ArrayList集合
20         Iterator<String> listIt = list.iterator();
21         while(listIt.hasNext()){
22             System.out.println(listIt.next());
23         }
24         //使用疊代器周遊Set集合
25         Iterator<String> setIt = set.iterator();
26         while(setIt.hasNext()){
27             System.out.println(listIt.next());
28         }
29         //使用疊代器周遊LinkedList集合
30         Iterator<String> linkIt = linkList.iterator();
31         while(linkIt.hasNext()){
32             System.out.println(listIt.next());
33         }
34 }      

使用foreach周遊集合:

List<String> list = new ArrayList<String>();
        list.add("張三1");
        list.add("張三2");
        list.add("張三3");
        list.add("張三4");
        for (String string : list) {
            System.out.println(string);
        }      

  可以看出使用foreach周遊集合的優勢在于代碼更加的簡潔,更不容易出錯,不用關心下标的起始值和終止值。

 3.Iterator周遊時不可以删除集合中的元素問題

   在使用Iterator的時候禁止對所周遊的容器進行改變其大小結構的操作。例如: 在使用Iterator進行疊代時,如果對集合進行了add、remove操作就會出現ConcurrentModificationException異常。

1         List<String> list = new ArrayList<String>();
 2         list.add("張三1");
 3         list.add("張三2");
 4         list.add("張三3");
 5         list.add("張三4");
 6         
 7         //使用疊代器周遊ArrayList集合
 8         Iterator<String> listIt = list.iterator();
 9         while(listIt.hasNext()){
10             Object obj = listIt.next();
11             if(obj.equals("張三3")){
12                 list.remove(obj);
13             }
14         }      

  因為在你疊代之前,疊代器已經被通過list.itertor()建立出來了,如果在疊代的過程中,又對list進行了改變其容器大小的操作,那麼Java就會給出異常。因為此時Iterator對象已經無法主動同步list做出的改變,Java會認為你做出這樣的操作是線程不安全的,就會給出善意的提醒(抛出ConcurrentModificationException異常)

Iterator的實作源碼:  

1     private class Itr implements Iterator<E> {
 2         int cursor;       // index of next element to return
 3         int lastRet = -1; // index of last element returned; -1 if no such
 4         int expectedModCount = modCount;
 5 
 6         public boolean hasNext() {
 7             return cursor != size;
 8         }
 9 
10         @SuppressWarnings("unchecked")
11         public E next() {
12             checkForComodification();
13             int i = cursor;
14             if (i >= size)
15                 throw new NoSuchElementException();
16             Object[] elementData = ArrayList.this.elementData;
17             if (i >= elementData.length)
18                 throw new ConcurrentModificationException();
19             cursor = i + 1;
20             return (E) elementData[lastRet = i];
21         }
22 
23         public void remove() {
24             if (lastRet < 0)
25                 throw new IllegalStateException();
26             checkForComodification();
27 
28             try {
29                 ArrayList.this.remove(lastRet);
30                 cursor = lastRet;
31                 lastRet = -1;
32                 expectedModCount = modCount;
33             } catch (IndexOutOfBoundsException ex) {
34                 throw new ConcurrentModificationException();
35             }
36         }
37 
38         final void checkForComodification() {
39             if (modCount != expectedModCount)
40                 throw new ConcurrentModificationException();
41         }
42     }      

  通過檢視源碼發現原來檢查并抛出異常的是checkForComodification()方法。在ArrayList中modCount是目前集合的版本号,每次修改(增、删)集合都會加1;expectedModCount是目前疊代器的版本号,在疊代器執行個體化時初始化為modCount。我們看到在checkForComodification()方法中就是在驗證modCount的值和expectedModCount的值是否相等,是以當你在調用了ArrayList.add()或者ArrayList.remove()時,隻更新了modCount的狀态,而疊代器中的expectedModCount未同步,是以才會導緻再次調用Iterator.next()方法時抛出異常。但是為什麼使用Iterator.remove()就沒有問題呢?通過源碼的第32行發現,在Iterator的remove()中同步了expectedModCount的值,是以當你下次再調用next()的時候,檢查不會抛出異常。

  使用該機制的主要目的是為了實作ArrayList中的快速失敗機制(fail-fast),在Java集合中較大一部分集合是存在快速失敗機制的。

  快速失敗機制産生的條件:當多個線程對Collection進行操作時,若其中某一個線程通過Iterator周遊集合時,該集合的内容被其他線程所改變,則會抛出ConcurrentModificationException異常。

  是以要保證在使用Iterator周遊集合的時候不出錯誤,就應該保證在周遊集合的過程中不會對集合産生結構上的修改。

 使用Foreach時對集合的結構進行修改會出現異常:

  上面我們說了實作了Iterable接口的類就可以通過Foreach周遊,那是因為foreach要依賴于Iterable接口傳回的Iterator對象,是以從本質上來講,Foreach其實就是在使用疊代器,在使用foreach周遊時對集合的結構進行修改,和在使用Iterator周遊時對集合結構進行修改本質上是一樣的。是以同樣的也會抛出異常,執行快速失敗機制。

  foreach是JDK1.5新增加的一個循環結構,foreach的出現是為了簡化我們周遊集合的行為。

 for循環與疊代器的對比:

  * 效率上各有各的優勢:

    > ArrayList對随機通路比較快,而for循環中使用的get()方法,采用的即是随機通路的方法,是以在ArrayList裡for循環快。

    > LinkedList則是順序通路比較快,Iterator中的next()方法采用的是順序通路方法,是以在LinkedList裡使用Iterator較快。

    > 主要還是要依據集合的資料結構不同的判斷。