天天看點

《Python資料科學實踐指南》一1.4 使用Python shell調試程式

本節書摘來自華章出版社《python資料科學實踐指南》一書中的第1章,第1.4節,紀路 著,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

python shell不僅為python初學者提供了一個友善的入門工具,更是提高了專業程式員和資料科學家們的生産力。比如在編寫程式時忘記了某個表達式的寫法,可以打開python shell,在裡面調試好了之後再寫入程式。或者直接在python shell中探索原始資料檔案中的資料,變換資料的結構,執行計數、去重、分組等操作。并且可以随時檢視前輩們留給我們的建議,比如在python shell中輸入import this,将導入python中一個名為this的子產品:

大意是:

命名空間是一個令人拍手稱贊的好點子,讓我們善加利用

通過上面的例子,我們已經知道了python中子產品的概念,子產品是python中最大的代碼機關,以後我們還會學到檔案、函數、文法塊等不同級别的python代碼機關。在一個python的子產品中可能會包含一個到多個不同的功能,python中随解釋器一起分發的标準子產品有300多個,可以應付絕大多數的程式設計任務,也确實有些程式員堅持隻使用标準庫提供的子產品。不過本書提倡的是另外一種程式設計的哲學,即“不要重複造輪子”,隻要某一個功能已經被别人實作為子產品了,那麼最好拿來就用,而不是自己重新編寫。是以我們會安裝很多第三方子產品,這些子產品也是非常優秀的,隻是還沒有被收錄進官方的标準子產品中,也是基于此,下面将使用pip來安裝第三方子產品。不過,根據作業系統的不同,安裝方式也略有差別,如果讀者使用mac或linux系統,那麼按照之前的教程并沒有經曆安裝python解釋器的步驟,是以這裡需要讀者确認一下自己的python版本。可以在終端輸入python,比如:

在輸出的第一行python代碼之後,由點号分隔的部分就是python的版本,例如上述代碼中顯示的版本是2.7.11。如果你的python版本為2.7.9或高于該版本,那麼你無須任何操作就已經擁有了pip程式,可以在終端中輸入pip嘗試一下,會有類似下面的輸出:

将腳本下載下傳到某一個目錄中,然後使用下面的指令進行安裝:

$sudo python get-pip.py

由于mac系統和linux系統權限的要求,這一步需要你輸入電腦的開機密碼。

對于windows系統來說,如果是參考本書的安裝方式進行安裝的,那麼你已經獲得了最新版本的python,也就表示你已經擁有了pip,可以直接使用。

使用pip安裝python的第三方子產品非常簡單,比如我們要安裝requests這個第三方子產品,可以使用下面的指令:

$pip install requests

一般來講,windows的使用者直接運作這個指令就可以安裝了,而mac或linux使用者由于系統權限的原因需要在指令的最前方增加sudo這個指令,代碼如下:

$sudo pip install requests

以後的章節中将不再強調這一差別,請讀者根據自己的系統使用相對應的指令。另外有一部分因為曆史原因,第三方庫是使用c語言編寫的,是以很可能還需要你的電腦上裝有c/c++編譯器。對于mac和linux來說,就是gcc編譯器,對于windows來說則是visual studio。

在上述過程的實踐中,大家可能會遇到各種各樣的問題,本書無法窮盡所有可能會遇到的問題,是以當遇到具體的問題時應當盡量求助于搜尋引擎。關于使用搜尋引擎,筆者自己有一條最基本的原則:我不可能是第一個遇到該問題的人!隻要遵守這個原則,絕大多數情況下都能找到令人滿意的答案。