天天看点

《Python数据科学实践指南》一1.4 使用Python shell调试程序

本节书摘来自华章出版社《python数据科学实践指南》一书中的第1章,第1.4节,纪路 著,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

python shell不仅为python初学者提供了一个方便的入门工具,更是提高了专业程序员和数据科学家们的生产力。比如在编写程序时忘记了某个表达式的写法,可以打开python shell,在里面调试好了之后再写入程序。或者直接在python shell中探索原始数据文件中的数据,变换数据的结构,执行计数、去重、分组等操作。并且可以随时查看前辈们留给我们的建议,比如在python shell中输入import this,将导入python中一个名为this的模块:

大意是:

命名空间是一个令人拍手称赞的好点子,让我们善加利用

通过上面的例子,我们已经知道了python中模块的概念,模块是python中最大的代码单位,以后我们还会学到文件、函数、语法块等不同级别的python代码单位。在一个python的模块中可能会包含一个到多个不同的功能,python中随解释器一起分发的标准模块有300多个,可以应付绝大多数的编程任务,也确实有些程序员坚持只使用标准库提供的模块。不过本书提倡的是另外一种编程的哲学,即“不要重复造轮子”,只要某一个功能已经被别人实现为模块了,那么最好拿来就用,而不是自己重新编写。所以我们会安装很多第三方模块,这些模块也是非常优秀的,只是还没有被收录进官方的标准模块中,也是基于此,下面将使用pip来安装第三方模块。不过,根据操作系统的不同,安装方式也略有区别,如果读者使用mac或linux系统,那么按照之前的教程并没有经历安装python解释器的步骤,因此这里需要读者确认一下自己的python版本。可以在终端输入python,比如:

在输出的第一行python代码之后,由点号分隔的部分就是python的版本,例如上述代码中显示的版本是2.7.11。如果你的python版本为2.7.9或高于该版本,那么你无须任何操作就已经拥有了pip程序,可以在终端中输入pip尝试一下,会有类似下面的输出:

将脚本下载到某一个目录中,然后使用下面的命令进行安装:

$sudo python get-pip.py

由于mac系统和linux系统权限的要求,这一步需要你输入电脑的开机密码。

对于windows系统来说,如果是参考本书的安装方式进行安装的,那么你已经获得了最新版本的python,也就表示你已经拥有了pip,可以直接使用。

使用pip安装python的第三方模块非常简单,比如我们要安装requests这个第三方模块,可以使用下面的命令:

$pip install requests

一般来讲,windows的用户直接运行这个命令就可以安装了,而mac或linux用户由于系统权限的原因需要在命令的最前方增加sudo这个命令,代码如下:

$sudo pip install requests

以后的章节中将不再强调这一区别,请读者根据自己的系统使用相对应的命令。另外有一部分因为历史原因,第三方库是使用c语言编写的,因此很可能还需要你的电脑上装有c/c++编译器。对于mac和linux来说,就是gcc编译器,对于windows来说则是visual studio。

在上述过程的实践中,大家可能会遇到各种各样的问题,本书无法穷尽所有可能会遇到的问题,所以当遇到具体的问题时应当尽量求助于搜索引擎。关于使用搜索引擎,笔者自己有一条最基本的原则:我不可能是第一个遇到该问题的人!只要遵守这个原则,绝大多数情况下都能找到令人满意的答案。