天天看點

Python元程式設計:控制你想控制的一切

專 欄

❈松直,Python中文社群專欄作者,計算機在讀,Python擁趸,知乎專欄:從Python開始❈

很多人不了解“元程式設計”是個什麼東西,關于它也沒有一個十分準确的定義。這篇文章要說的是Python裡的元程式設計,實際上也不一定就真的符合“元程式設計”的定義。隻不過我無法找到一個更準确的名字來代表這篇文章的主題,是以就借了這麼一個名号。

副标題是控制你想控制的一切,實際上這篇文章講的都是一個東西,利用Python提供給我們的特性,盡可能的使代碼優雅簡潔。具體而言,通過程式設計的方法,在更高的抽象層次上對一種層次的抽象的特性進行修改。

首先說,Python中一切皆對象,老生常談。還有,Python提供了許多特殊方法、元類等等這樣的“元程式設計”機制。像給對象動态添加屬性方法之類的,在Python中根本談不上是“元程式設計”,但在某些靜态語言中卻是需要一定技巧的東西。我們來談些Python程式員也容易被搞糊塗的東西。

我們先來把對象分分層次,通常我們知道一個對象有它的類型,老早以前Python就将類型也實作為對象。這樣我們就有了執行個體對象和類對象。這是兩個層次。稍有基礎的讀者就會知道還有元類這個東西的存在,簡言之,元類就是“類”的“類”,也就是比類更高層次的東西。這又有了一個層次。還有嗎?

ImportTime vs RunTime

如果我們換個角度,不用非得和之前的三個層次使用同樣的标準。我們再來區分兩個東西:ImportTime和RunTime,它們之間也并非界限分明,顧名思義,就是兩個時刻,導入時和運作時。

當一個子產品被導入時,會發生什麼?在全局作用域的語句(非定義性語句)被執行。函數定義呢?一個函數對象被建立,但其中的代碼不會被執行。類定義呢?一個類對象被建立,類定義域的代碼被執行,類的方法中的代碼自然也不會被執行。

執行時呢?函數和方法中的代碼會被執行。當然你要先調用它們。

元類

是以我們可以說元類和類是屬于ImportTime的,import一個子產品之後,它們就會被建立。執行個體對象屬于RunTime,單import是不會建立執行個體對象的。不過話不能說的太絕對,因為如果你要是在子產品作用域執行個體化類,執行個體對象也是會被建立的。隻不過我們通常把它們寫在函數裡面,是以這樣劃分。

如果你想控制産生的執行個體對象的特性該怎麼做?太簡單了,在類定義中重寫init方法。那麼我們要控制類的一些性質呢?有這種需求嗎?當然有!

經典的單例模式,大家都知道有很多種實作方式。要求就是,一個類隻能有一個執行個體。

最簡單的實作方法是這樣的

Python元程式設計:控制你想控制的一切

工廠模式,不太優雅。我們再來審視一下需求,要一個類隻能有一個執行個體。我們在類中定義的方法都是執行個體對象的行為,那麼要想改變類的行為,就需要更高層次的東西。元類在這個時候登場在合适不過了。前面說過,元類是類的類。也就是說,元類的init方法就是類的初始化方法。 我們知道還有call這個東西,它能讓執行個體像函數那樣被調用,那麼元類的這個方法就是類在被執行個體化時調用的方法。

代碼就可以寫出來了:

Python元程式設計:控制你想控制的一切

主要有兩個地方和一般的類定義不同,一是Singleton的基類是type,一是Spam定義的地方有一個metaclass=Singleton。type是什麼?它是object的子類,object是它的執行個體。也就是說,type是所有類的類,也就是最基本的元類,它規定了一些所有類在産生時需要的一些操作。是以我們的自定義元類需要子類化type。同時type也是一個對象,是以它又是object的子類。有點不太好了解,大概知道就可以了。

裝飾器

我們再來說說裝飾器。大多數人認為裝飾器是Python裡面最難了解的概念之一。其實它不過就是一個文法糖,了解了函數也是對象之後。就可以很輕易的寫出自己的裝飾器了。

Python元程式設計:控制你想控制的一切

這裡我們還用到了一個裝飾器@wraps,它是用來讓我們傳回的内部函數wrapper和原來的函數擁有相同的函數簽名的,基本上我們在寫裝飾器時都要加上它。

我在注釋裡寫了,@decorator這樣的形式等價于func=decorator(func),了解了這一點,我們就可以寫出更多種類的裝飾器。比如類裝飾器,以及将裝飾器寫成一個類。

Python元程式設計:控制你想控制的一切

注意普通的裝飾器和類裝飾器實作的不同點。

對資料的抽象--描述符

如果我們想讓某一些類擁有某些相同的特性,或者說可以實作在類定義對其的控制,我們可以自定義一個元類,然後讓它成為這些類的元類。如果我們想讓某一些函數擁有某些相同的功能,又不想把代碼複制粘貼一遍,我們可以定義一個裝飾器。那麼,假如我們想讓執行個體的屬性擁有某些共同的特點呢?有人可能會說可以用property,當然可以。但是這些邏輯必須在每個類定義的時候都寫一遍。如果我們想讓這些類的執行個體的某些屬性都有相同的特點的話,就可以自定義一個描述符類。

關于描述符,這篇文章https://docs.python.org/3/howto/descriptor.html講得很好,同時它還講解了描述符是怎麼隐藏在函數的背後,實作函數、方法的統一和不同的。這裡我們給出一些例子。

Python元程式設計:控制你想控制的一切

在這裡面有幾個角色,TypedField是一個描述符類,Person的屬性是描述符類的執行個體,看似描述符是作為Person,也就是類的屬性而不是執行個體屬性存在的。但實際上,一旦Person的執行個體通路了同名的屬性,描述符就會起作用。需要注意的是,在Python3.5及之前的版本中,是沒有set_name這個特殊方法的,這意味着如果你想要知道在類定義中描述符被起了一個什麼樣的名字,是需要在描述符執行個體化時顯式傳遞給它的,也就是需要多一個參數。不過在Python3.6中,這個問題得到了解決,隻需要在描述符類定義中重寫set_name這個方法就好了。還需要注意的是get的寫法,基本上對instance的判斷是必需的,不然會報錯。原因也不難了解,就不細說了。

控制子類的建立——代替元類的方法

在Python3.6中,我們可以通過實作init_subclass特殊方法,來自定義子類的建立,這樣我們就可以在某些情況下擺脫元類這個讨厭的東西。

Python元程式設計:控制你想控制的一切

小結

諸如元類等元程式設計對于大多數人來說有些晦澀難懂,大多數時候也無需用到它們。但是大多數架構背後的實作都使用到了這些技巧,這樣才能讓使用者寫出來的代碼簡潔易懂。如果你想更深入的了解這些技巧,可以參看一些書籍例如《Fluent Python》、《Python Cookbook》(這篇文章有的内容就是參考了它們),或者看官方文檔中的某些章節例如上文說的描述符HowTo,還有Data Model一節等等。或者直接看Python的源碼,包括用Python寫的以及CPython的源碼。

記住,隻有在充分了解了它們之後再去使用,也不要是個地方就想着使用這些技巧。