本文出自“Python為什麼”系列,請檢視全部文章
在<code>Python貓</code>的上一篇文章中,我們對比了兩種建立清單的方法,即字面量用法 [] 與内置類型用法 list(),進而分析出它們在運作速度上的差異。
在分析為什麼 list() 會更慢的時候,文中說到它需要經過名稱查找與函數調用兩個步驟,那麼,這就引出了一個新的問題:list() 不是内置類型麼,為什麼它不能直接就調用建立清單的邏輯呢?也就是說,為什麼解釋器必須經過名稱查找,才能“認識”到該做什麼呢?
其實原因很簡單:内置函數/内置類型的名稱并不是關鍵字,它們隻是解釋器内置的一種便捷功能,友善開發者開箱即用而已。
PS:内置函數 built-in function 和内置類型 built-in type 很相似,但 list() 實際是一種内置類型而不是内置函數。我曾對這兩種易混淆的概念做過辨析,請檢視這篇文章。為了友善了解與表述,以下統稱為内置函數。
内置函數的名稱并不屬于關鍵字,它們是可以被重新指派的。
比如下面這個例子:
在這個例子中,我們将自定義的 test 指派給了 list,程式并沒有報錯。這個例子甚至還可以改成直接定義新的同名函數,即"def list(): …"。
這說明了 list 并不是 Python 限定的關鍵字/保留字。
檢視官方文檔,可以發現 Python 3.9 有 35 個關鍵字,明細如下:
如果我們将上例的 test 指派給任意一個關鍵字,例如"pass=test",就會報錯:SyntaxError: invalid syntax。
由此,我們可以從這個角度看出内置函數并不是萬能的:它們的名稱并不像關鍵字那般穩固不變,雖然它們處在系統内置作用域裡,但是卻可以被使用者局部作用域的對象所輕松攔截掉!
因為解釋器查找名稱的順序是“局部作用域->全局作用域->内置作用域”,是以内置函數其實是處在最低優先級。
對于新手來說,這有一定的可能會發生意想不到的情況(内置函數有 69 個,要全記住是有難度的)。
那麼,為什麼 Python 不把所有内置函數的名稱都設為不可複寫的關鍵字呢?
一方面原因是它想控制關鍵字的數量,另一方面可能是想留給使用者更多的自由。内置函數隻是解釋器的推薦實作而已,開發者可以根據需要,實作出與内置函數同名的函數。
不過,這樣的場景極少,而且開發者一般會定義成不同名的函數,以 Python 标準庫為例,<code>ast</code>子產品有 literal_eval() 函數(對标 eval() 内置函數)、<code>pprint</code> 子產品有 pprint() 函數(對标 print() 内置函數)、以及<code>itertools</code>子產品有 zip_longest() 函數(對标 zip() 内置函數)……
由于内置函數的名稱并非保留的關鍵字,以及它處于名稱查找的末位順序,是以内置函數有可能不是最快的。
上篇文章展示了 [] 比 list() 快 2~3 倍的事實,其實這還可以推廣到 str()、tuple()、set()、dict() 等等内置類型中,都是字面量用法稍稍快于内置類型用法。
對于這些内置類型,當我們調用 xxx() 時,可以簡單了解成正在做類的執行個體化。在面向對象語言中,類先執行個體化再使用,這是再正常不過的。
但是,這樣的做法有時也顯得繁瑣。為了友善使用,Python 給一些常用的内置類型提供了字面量表示法,也就是""、[]、()、{} 等等,表示字元串、清單、元組和字典等資料類型。
文檔出處:https://docs.python.org/3/reference/lexical_analysis.html#delimiters
一般而言,所有程式設計語言都必須有一些字面量表示,但基本都局限在數字類型、字元串、布爾類型以及 null 之類的基礎類型。
Python 中還增加了幾種資料結構類型的字面量,是以是更為友善的,同時這也解釋了為什麼内置函數可能不是最快的。
一般而言,同樣的完備功能,内置函數總是比我們自定義的函數要快,因為解釋器可以做一些底層的優化,例如 len() 内置函數肯定比使用者定義的 x.len() 函數快。
有些人據此形成了“内置函數總是更快”的認識誤區。
解釋器内置函數相對于使用者定義函數,前者接近于走後門;而字面量表示法相對于内置函數,前者是在走更快的後門。
也就是說,在有字面量表示法的情況下,某些内置函數/内置類型并不是最快的!
誠然,Python 本身并不是萬能的,那它的任何文法構成部分(内置函數/類型),就更不是萬能的了。但是,一般我們會認為内置函數/類型總歸是“高人一等”的,是受到諸多特殊優待的,顯得像是“萬能的”。
本文從“list() 竟然會敗給 []”破題,從兩個角度揭示了内置函數其實存在着某種不足:内置函數的名稱并不是關鍵字,而内置作用域位于名稱查找的最低優先級,是以在調用時,某些内置函數/類型的執行速度就明顯慢于它們對應的字面量表示法。
本文對上一個“Python為什麼”話題做了延展讨論,一方面充實了前面的内容,另一方面,也有助于大家了解 Python 的幾個基礎概念及其實作。
如果你喜歡本文,請點贊支援下吧!另外,我還寫了 20+ 篇類似的話題,請關注<code>Python貓</code>檢視,并在 Github 上給我一顆小星星吧~~
--->>>最後是福利時刻:
我把兩年寫作的 100 多篇精品文章集結成了一本 700 多頁的《優雅的Python》電子書,誠意推薦!!請在微信關注<code>Python貓</code> ,回複“優雅”兩字擷取~~