天天看点

RPA应用:Python 十大装 X 语法(二)

艺赛旗 RPA9.0全新首发免费下载 点击下载

http://www.i-search.com.cn/index.html?from=line1

  1. 列表索引的各种骚操作

    Python 引入负整数作为数组的索引,这绝对是喜大普奔之举。想想看,在 C/C++ 中,想要数组最后一个元素,得先取得数组长度,减一之后做索引,严重影响了思维的连贯性。Python 语言之所以获得成功,我个人觉得,在诸多因素里面,列表操作的便捷性是不容忽视的一点。请看:

a = [0, 1, 2, 3, 4, 5]

a[2:4]

[2, 3]

a[3:]

[3, 4, 5]

a[1:]

[1, 2, 3, 4, 5]

a[:]

[0, 1, 2, 3, 4, 5]

a[::2]

[0, 2, 4]

a[1::2]

[1, 3, 5]

a[-1]

5

a[-2]

4

a[1:-1]

[1, 2, 3, 4]

a[::-1]

[5, 4, 3, 2, 1, 0]

如果说,这些你都很熟悉,也经常用,那么接下来这个用法,你一定会感觉很神奇:

a = [0, 1, 2, 3, 4, 5]

b = [‘a’, ‘b’]

a[2:2] = b

a

[0, 1, ‘a’, ‘b’, 2, 3, 4, 5]

a[3:6] = b

a

[0, 1, ‘a’, ‘a’, ‘b’, 4, 5]

  1. lambda 函数

    lambda 听起来很高大上,其实就是匿名函数(了解 js 的同学一定很熟悉匿名函数)。匿名函数的应用场景是什么呢?就是仅在定义匿名函数的地方使用这个函数,其他地方用不到,所以就不需要给它取个阿猫阿狗之类的名字了。下面是一个求和的匿名函数,输入参数有两个,x 和 y,函数体就是 x+y,省略了 return 关键字。

lambda x,y: x+y

<function at 0x000001B2DE5BD598>

(lambda x,y: x+y)(3,4) # 因为匿名函数没有名字,使用的时候要用括号把它包起来

匿名函数一般不会单独使用,而是配合其他方法,为其他方法提供内置的算法或判断条件。比如,使用排序函数 sorted 对多维数组或者字典排序时,就可以指定排序规则。

a = [{‘name’:‘B’, ‘age’:50}, {‘name’:‘A’, ‘age’:30}, {‘name’:‘C’, ‘age’:40}]

sorted(a, key=lambda x:x[‘name’]) # 按姓名排序

[{‘name’: ‘A’, ‘age’: 30}, {‘name’: ‘B’, ‘age’: 50}, {‘name’: ‘C’, ‘age’: 40}]

sorted(a, key=lambda x:x[‘age’]) # 按年龄排序

[{‘name’: ‘A’, ‘age’: 30}, {‘name’: ‘C’, ‘age’: 40}, {‘name’: ‘B’, ‘age’: 50}]

再举一个数组元素求平方的例子,这次用 map 函数:

a = [1,2,3]

for item in map(lambda x:x*x, a):

print(item, end=’, ')

1, 4, 9,

8. yield 以及生成器和迭代器

yield 这词儿,真不好翻译,翻词典也没用。我干脆就读作“一爱得”,算是外来词汇吧。要理解 yield,得先了解 generator(生成器)。要了解 generator,得先知道 iterator(迭代器)。哈哈哈,绕晕了吧?算了,我还是说白话吧。

话说 py2 时代,range()返回的是 list,但如果 range(10000000) 的话,会消耗大量内存资源,所以,py2 又搞了一个 xrange()来解决这个问题。py3 则只保留了 xrange(),但写作 range()。xrange() 返回的就是一个迭代器,它可以像 list 那样被遍历,但又不占用多少内存。generator(生成器)是一种特殊的迭代器,只能被遍历一次,遍历结束,就自动消失了。总之,不管是迭代器还是生成器,都是为了避免使用 list,从而节省内存。那么,如何得到迭代器和生成器呢?

python 内置了迭代函数 iter,用于生成迭代器,用法如下:

a = [1,2,3]

a_iter = iter(a)

a_iter

<list_iterator object at 0x000001B2DE434BA8>

for i in a_iter:

print(i, end=’, ')

1, 2, 3,

yield 则是用于构造生成器的。比如,我们要写一个函数,返回从 0 到某正整数的所有整数的平方,传统的代码写法是这样的:

def get_square(n):

result = list()

for i in range(n):

result.append(pow(i,2))

return result

print(get_square(5))

[0, 1, 4, 9, 16]

但是如果计算 1 亿以内的所有整数的平方,这个函数的内存开销会非常大,这是 yield 就可以大显身手了:

def get_square(n):

for i in range(n):

yield(pow(i,2))

a = get_square(5)

a

<generator object get_square at 0x000001B2DE5CACF0>

for i in a:

print(i, end=’, ')

0, 1, 4, 9, 16,

如果再次遍历,则不会有输出了。

  1. 装饰器

    刚弄明白迭代器和生成器,这又来个装饰器,Python 咋这么多器呢?的确,Python 为我们提供了很多的武器,装饰器就是最有力的武器之一。装饰器很强大,我在这里尝试从需求的角度,用一个简单的例子,说明装饰器的使用方法和制造工艺。

假如我们需要定义很多个函数,在每个函数运行的时候要显示这个函数的运行时长,解决方案有很多。比如,可以在调用每个函数之前读一下时间戳,每个函数运行结束后再读一下时间戳,求差即可;也可以在每个函数体内的开始和结束位置上读时间戳,最后求差。不过,这两个方法,都没有使用装饰器那么简单、优雅。下面的例子,很好地展示了这一点。

import time

def timer(func):

def wrapper(*args,**kwds):

t0 = time.time()

func(*args,**kwds)

t1 = time.time()

print(‘耗时%0.3f’%(t1-t0,))

return wrapper

@timer

def do_something(delay):

print(‘函数do_something开始’)

time.sleep(delay)

print(‘函数do_something结束’)

do_something(3)

函数do_something开始

函数do_something结束

耗时3.077

timer()是我们定义的装饰器函数,使用 @把它附加在任何一个函数(比如 do_something)定义之前,就等于把新定义的函数,当成了装饰器函数的输入参数。运行 do_something() 函数,可以理解为执行了 timer(do_something) 。细节虽然复杂,不过这么理解不会偏差太大,且更易于把握装饰器的制造和使用。

  1. 巧用断言 assert

    所谓断言,就是声明表达式的布尔值必须为真的判定,否则将触发 AssertionError 异常。严格来讲,assert 是调试手段,不宜使用在生产环境中,但这不影响我们用断言来实现一些特定功能,比如,输入参数的格式、类型验证等。

def i_want_to_sleep(delay):

assert(isinstance(delay, (int,float))), ‘函数参数必须为整数或浮点数’

print(‘开始睡觉’)

time.sleep(delay)

print(‘睡醒了’)

i_want_to_sleep(1.1)

开始睡觉

睡醒了

i_want_to_sleep(2)

开始睡觉

睡醒了

i_want_to_sleep(‘2’)

Traceback (most recent call last):

File “<pyshell#247>”, line 1, in

i_want_to_sleep(‘2’)

File “<pyshell#244>”, line 2, in i_want_to_sleep

assert(isinstance(delay, (int,float))), ‘函数参数必须为整数或浮点数’

AssertionError: 函数参数必须为整数或浮点数