天天看點

Python垃圾回收機制

  • 引用計數

    Python預設的垃圾收集機制是“引用計數”,每個對象維護了一個ob_ref字段。它的優點是機制簡單,當新的引用指向該對象時,引用計數加1,當一個對象的引用被銷毀時減1,一旦對象的引用計數為0,該對象立即被回收,所占用的記憶體将被釋放。它的缺點是需要額外的空間維護引用計數,不過最主要的問題是它不能解決“循環引用”。

    什麼是循環引用?A和B互相引用而再沒有外部引用A與B中的任何一個,它們的引用計數雖然都為1,但顯然應該被回收,例子:

    a = { } # a 的引用為 1
      b = { } # b 的引用為 1
      a['b'] = b # b 的引用增 1,b的引用為2
      b['a'] = a # a 的引用增 1,a的引用為 2
      del a # a 的引用減 1,a的引用為 1
      del b # b 的引用減 1, b的引用為 1
               
    在這個例子中,del語句減少了 a 和 b 的引用計數并删除了用于引用的變量名,可是由于兩個對象各包含一個對方對象的引用,雖然最後兩個對象都無法通過名字通路了,但引用計數并沒有減少到零。是以這個對象不會被銷毀,它會一直駐留在記憶體中,這就造成了記憶體洩漏。為了解決循環引用問題,Python引入了标記-清除和分代回收兩種GC機制。
  • 标記清除

    标記——清除(Mark——Sweep)是一種基于追蹤(Tracing)回收技術實作的垃圾回收算法,對象之間通過引用(指針)連在一起,構成一個有向圖,對象構成這個有向圖的節點,而引用關系構成這個有向圖的邊。從根對象(root object)出發,沿着有向邊周遊對象,可達的對象标記為有用的對象,不可達的對象就是要被清除的對象。所謂根對象就是一些全局引用對象和函數棧中的引用,這些引用所引用的對象是不可被删除的。

    标記清除算法作為Python的輔助垃圾收集技術主要處理的是一些容器對象,比如list、dict、tuple,instance等,因為對于字元串、數值對象是不可能造成循環引用問題。Python使用一個雙向連結清單将這些容器對象組織起來。

  • 分代回收

    分代回收是一種以空間換時間的操作方式,Python将記憶體根據對象的存活時間劃分為不同的集合,每個集合稱為一個代,Python将記憶體分為了3“代”,分别為年輕代(第0代)、中年代(第1代)、老年代(第2代),他們對應的是3個連結清單,它們的垃圾收集頻率與對象的存活時間的增大而減小。新建立的對象都會配置設定在年輕代,年輕代連結清單的總數達到上限時,Python垃圾收集機制就會被觸發,把那些可以被回收的對象回收掉,而那些不會回收的對象就會被移到中年代去,依此類推,老年代中的對象是存活時間最久的對象,甚至是存活于整個系統的生命周期内。同時,分代回收是建立在标記清除技術基礎之上。

    分代回收同樣作為Python的輔助垃圾收集技術處理那些容器對象

FROM: http://foofish.net/blog/94/python-gc