天天看点

《Python数据科学实践指南》——1.4节使用Python shell调试程序

本节书摘来自华章社区《python数据科学实践指南》一书中的第1章,第1.4节使用python shell调试程序,作者纪路,更多章节内容可以访问云栖社区“华章社区”公众号查看

1.4 使用python shell调试程序

python shell不仅为python初学者提供了一个方便的入门工具,更是提高了专业程序员和数据科学家们的生产力。比如在编写程序时忘记了某个表达式的写法,可以打开python shell,在里面调试好了之后再写入程序。或者直接在python shell中探索原始数据文件中的数据,变换数据的结构,执行计数、去重、分组等操作。并且可以随时查看前辈们留给我们的建议,比如在python shell中输入import this,将导入python中一个名为this的模块:

大意是:

python 之道

美丽优于丑陋

明确优于晦涩

简单胜于复杂

复杂胜于混乱

平铺胜于嵌套

稀疏胜于紧凑

可读性很重要

尽管实用性很重要,但也不能破例违背上述原则

绝不让错误无声无息,除非你想这么做

面对模棱两可时,不要妄想猜测能解决问题

应该只有一种最适合的,且显而易见的解决方案

可能这种方案一开始并不那么显而易见,因为你不是python之父

做比不做强,但是随意做还不如不做

很难向别人解释的方案是不好的

很容易向别人解释的方案也许是好的

命名空间是一个令人拍手称赞的好点子,让我们善加利用

通过上面的例子,我们已经知道了python中模块的概念,模块是python中最大的代码单位,以后我们还会学到文件、函数、语法块等不同级别的python代码单位。在一个python的模块中可能会包含一个到多个不同的功能,python中随解释器一起分发的标准模块有300多个,可以应付绝大多数的编程任务,也确实有些程序员坚持只使用标准库提供的模块。不过本书提倡的是另外一种编程的哲学,即“不要重复造轮子”,只要某一个功能已经被别人实现为模块了,那么最好拿来就用,而不是自己重新编写。所以我们会安装很多第三方模块,这些模块也是非常优秀的,只是还没有被收录进官方的标准模块中,也是基于此,下面将使用pip来安装第三方模块。不过,根据操作系统的不同,安装方式也略有区别,如果读者使用mac或linux系统,那么按照之前的教程并没有经历安装python解释器的步骤,因此这里需要读者确认一下自己的python版本。可以在终端输入python,比如:

在输出的第一行python代码之后,由点号分隔的部分就是python的版本,例如上述代码中显示的版本是2.7.11。如果你的python版本为2.7.9或高于该版本,那么你无须任何操作就已经拥有了pip程序,可以在终端中输入pip尝试一下,会有类似下面的输出:

以后的章节中将不再强调这一区别,请读者根据自己的系统使用相对应的命令。另外有一部分因为历史原因,第三方库是使用c语言编写的,因此很可能还需要你的电脑上装有c/c++编译器。对于mac和linux来说,就是gcc编译器,对于windows来说则是visual studio。

在上述过程的实践中,大家可能会遇到各种各样的问题,本书无法穷尽所有可能会遇到的问题,所以当遇到具体的问题时应当尽量求助于搜索引擎。关于使用搜索引擎,笔者自己有一条最基本的原则:我不可能是第一个遇到该问题的人!只要遵守这个原则,绝大多数情况下都能找到令人满意的答案。

下一篇: XML