天天看点

Python回顾与整理1:Python基础

        学习Python其实也有好一段时间了,之前也做了不少笔记,但是要真正把Python学得很扎实,没有对Python系统的了解是远远不够的,哪怕是最基础的知识点,所以决定好好地回顾整理。

        当然,就以《Python核心编程》这本书为纲,希望可以把自己对Python的理解连成系统的一条线。

1.语句和语法

`#`:注释

`\`:换行,如果是闭合操作符如`( )`,`[ ]`,`{ }`等,可以不使用`\`

`:`:分号将代码头和代码体分开

`缩进`:用以区分不同的代码块

`;`:同一行写多个语句,但不建议

`模块`:一个.py脚本文件就是一个模块

2.变量赋值

(1)赋值操作符:=

在Python中,对象是通过引用传递的,赋值时,是将该对象的引用(不是一个值)赋给这个变量。

另外,Python赋值语句没有返回值,但可以使用赋值链:

1

2

3

4

5

6

<code>&gt;&gt;&gt; a  </code><code>=</code>  <code>(a </code><code>=</code> <code>3</code><code>)</code>

<code>  </code><code>File</code> <code>"&lt;stdin&gt;"</code><code>, line </code><code>1</code>

<code>    </code><code>a </code><code>=</code> <code>(a</code><code>=</code><code>3</code><code>)</code>

<code>          </code><code>^</code>

<code>SyntaxError: invalid syntax</code>

<code>&gt;&gt;&gt; y </code><code>=</code> <code>x </code><code>=</code> <code>3</code>

(2)增量赋值

只有类似+=这样的增量赋值,没有自增自减的方法

特性:可变对象(列表,字典等)就修改(无需拷贝引用),不可变对象(数字,元组等)则分配一个新对象

(3)多重赋值

一个对象可被多个变量引用,多个对象也可被多个对象引用

<code>&gt;&gt;&gt; x </code><code>=</code> <code>y </code><code>=</code> <code>z </code><code>=</code><code>1</code>

(4)多元赋值:元组赋值

<code>&gt;&gt;&gt; (x, y, z) </code><code>=</code> <code>(</code><code>1</code><code>, </code><code>2</code><code>, </code><code>'a string'</code><code>)</code>

不加括号也可以,但建议加上

可用于两值的交换

<code>&gt;&gt;&gt; x </code><code>=</code> <code>3</code><code>; y </code><code>=</code> <code>4</code>

<code>&gt;&gt;&gt; </code><code>print</code> <code>x, y</code>

<code>3</code> <code>4</code>

<code>&gt;&gt;&gt; x, y </code><code>=</code> <code>y, x</code>

<code>4</code> <code>3</code>

3.标识符

关键字标识符:保留字,不能用于其他用途,否则会引起SyntaxError异常

内建(built-in)标识符:是__builtins__模块的成员,在程序开始或交互解释器开始时,由Python解释器自动导入,可以将其作为Python全局变量,可以重新赋值,但不建议

<code>&gt;&gt;&gt; </code><code>dir</code>

<code>&lt;built</code><code>-</code><code>in</code> <code>function </code><code>dir</code><code>&gt;</code>

<code>&gt;&gt;&gt; </code><code>dir</code><code>()</code>

<code>[</code><code>'__builtins__'</code><code>, </code><code>'__doc__'</code><code>, </code><code>'__name__'</code><code>, </code><code>'__package__'</code><code>]</code>

__专用下划线标识符:

__xxx:类中的私有变量名,不能用`from module import *`导入,变量是私有时,建议使用这种方法

__xxx__:系统定义名字,如内建标识符

    另外,Pythonn不支持标识符重载,所以任何时刻都只有一个名字绑定。

4.基本风格指南

注释:#号

文档:模块,类声明或函数声明中第一个没有赋值的字符串,可通过obj.__doc__访问

缩进:以空格代替制表符

标识符名称:名字简短有意义

Python风格指南:import this

(1)模块结构和布局

起始行(Unix)

<code>#/usr/bin/env python</code>

        这样仅输入脚本名字就可以执行脚本,无需直接调用解释器。

模块文档

<code>'</code><code>'this is a test module'</code><code>'</code>

        可通过obj.__doc__访问

模块导入

变量定义:尽量使用局部变量代替全局变量

类定义

函数定义

主程序

<code>if</code> <code>__name__ </code><code>=</code><code>=</code> <code>'__main__'</code><code>:</code>

<code>    </code><code>My_function()</code>

<code>#如果模块是被导入,__name__的值为模块名字;</code>

<code>#如果模块是被直接执行,__name__的值为'__main__';</code>

        关于主程序,注意下面几点:

1.绝大部分模块创建的目的是被其它模块导入而不是作为脚本执行,总之只有一个模块,也就是包含主程序的模块会被执行;

2.最高级别的Python语句(没有缩进)在模块被导入时就会被执行;

3.通常只有主程序模块中有大量的顶级可执行代码,所有其他被导入模块只应该有很少的顶级执行代码,所有的功能代码都应该封装在函数或类当中。

对于上面三点,只要联系自己在实际项目开发中的例子就可以很好的理解了。

(2)在主程序中书写测试代码

    如果想测试被导入的模块的某个函数的功能,就可以使用主程序的方法,引入并执行该函数,这就是测试功能的使用,当然在大型程序中,更倾向使用unittest。

5.内存管理

变量定义:变量无须事先声明

在Python中无需显式变量声明语句,变量在第一次赋值时自动声明。

动态类型:变量无须指定类型

Python中对象的类型和内存占用都是运行时确定的。

内存分配:不用关心内存管理

Python解释器承担了内在管理的复杂任务。

引用计数:对象回收

(1)增加引用计数

当对象被创建并(将其引用)赋值给变量时,该对象的引用计数就被设置为1

当一个对象(的引用)又被赋值给其他变量时,或作为参数传递给函数,方法或类实例时,或者被赋值为一个窗口对象(列表,字典等)的成员时,该对象新的一个引用会被创建,引用计数加1

<code>&gt;&gt;&gt; x </code><code>=</code> <code>3.14</code>    <code>#加1,下面每一步同理</code>

<code>&gt;&gt;&gt; y </code><code>=</code> <code>x</code>

<code>&gt;&gt;&gt; foobar(x)</code>

<code>&gt;&gt;&gt; myList </code><code>=</code> <code>[</code><code>123</code><code>, x, </code><code>'xyz'</code><code>]</code>

(2)减少引用计数

一个本地引用离开其作用范围

如函数执行完毕后局部变量被销毁。

对象别名被显式销毁

<code>&gt;&gt;&gt; </code><code>del</code> <code>y</code>

当变量被赋值给另外一个对象时,原对象的引用计数也会自动减1

<code>&gt;&gt;&gt; foo </code><code>=</code> <code>'xyz'</code>

<code>&gt;&gt;&gt; bar </code><code>=</code> <code>foo</code>

<code>&gt;&gt;&gt; foo </code><code>=</code> <code>123</code>

对象被从一个窗口对象中移除

<code>myList.remove(x)</code>

窗口对象本身被销毁

<code>del</code> <code>myList</code>

        即执行del y会产生下面两个结果:

1.从现在名称空间中删除y

2.y变量对应的对象的引用计数减1

需要注意的是,如果内存中仍然有在使用该对象,这会增加一个额外的引用,则它还不会被回收。

垃圾收集

        解释器跟踪对象的引用计数,垃圾收集器负责释放内存。其实际,垃圾收集器是一块独立代码,用来查找引用计数为0的对象和那些引用计数虽然大于0但也应该被销毁的对象(如循环引用的对象)。

        垃圾收集器 = 引用计数器 + 循环垃圾计数器,这在存在循环引用的情况中非常有用:

循环引用:发生在至少两个对象互相引用时,也就是当其它所有对它们的引用都消失时,他们两者所产生的对各自的引用仍然存在,例如两个类中有各自的一个实例

引用计数器作用:当一个对象的引用计数变为0,解释器会暂停,释放掉这个对象和仅有这个对象可访问(可到达的)其它对象(这样的话,其它对象的引用计数必然是1)

循环垃圾计数器作用:作为引用计数器的补充,垃圾收集器也会留心被分配的总量很大的(及未通过引用计数销毁的那些)对象,在这种情况下,解释器也会停下来,试图清理所有未引用的循环

        基本可以理解,但具体怎么实现的,就需要看Python的源码分析了。

6.第一个Python程序

    主要提及一点:使用局部变量替换模块变量。

    例如,你要使用os.linesep,如果你多次使用,那么建议将其定义为一个本模块的全局变量或局部变量,这将会加快查询的速度,因为对于os.linesep,要进行下面两步:

首先要查找os,确认其是一个模块

在这个模块中查找linesep变量

将经常用到的模块属性替换为一个本地引用,可以让程序跑得更快。

本文转自 xpleaf 51CTO博客,原文链接:http://blog.51cto.com/xpleaf/1750127,如需转载请自行联系原作者