天天看点

Python和Numpy

NumPy(Numerical Python Extensions)是一个第三方的开源Python包,用于科学计算,其前身是1995年开始开发的基于一个用于数组运算的库,经过长时间的发展,基本上成了绝大多数Python科学计算的基础包。

NumPy主要操作的对象是同种类型元素的多维数组/矩阵,并提供大量科学计算,尤其是线性代数,简单数学,逻辑,排序,选择,I/O,傅立叶变换,基本统计,随机模拟;而标准Python库中的array.array只提供少量功能。

官网如下简洁介绍:

强大的N维数组对象及处理

sophisticated (broadcasting) functions 强大的函数功能,broadcasting?

与C++与Fortran集成

线性代数、傅立叶转换和随机数生成函数

NumPy提供了两种基本的对象,ndarray(N-dimensional array object)和ufunc(universal function object)可以对其N维数组进行计算处理.

基础结构

多维数组ndarray

NumPy的主要对象是同质多维数组,矩阵。所为同质即其所有元素的类型都相同。其中维度称作轴axes,轴的数目称为秩rank。

ndarray.ndim:数组维度的数量,rank , 如2维数组的rank = 2;

ndarry.shape :  数组的维度,对于n行m列的矩阵,shape则是(n,m), 所以shape元组的长度即是rank

ndarry.size:多维数组总个数,如2*3矩阵size=6

内存结构

多维数组的内存结构分为两大对象,一块用来保存数据区域,一块用来描述元数据类型的dtype

Python和Numpy

多维数组创建

直接从标准数组创建:

b=np.array( [(1,2),(3,4)])

创建复数类型:

Python和Numpy

zeros:创建全部由0组成的数组

ones:则创建一个由1组成的数组

empty:随机由内存中数据生成

arange:安装指定规则生成

linspace:浮点数生成数组

Python和Numpy

简单方便,最后linspace则是针对浮点数,参数则是希望得到的元素个数,而非arange中的步长作为参数。

函数及操作

数组/矩阵基本操作

对于数组元素级别的操作:

Python和Numpy

包括数组元素的相减,自己元素*2,或者平方,或者进行判断操作。

同样对于,多维数组/矩阵也同样适用:

Python和Numpy

对于矩阵的简单基本操作我们已经可以看出NumPy的灵活方便。

对于我们关心的矩阵乘法,则需要使用函数dot

Python和Numpy

如上,a*b只是简单的对应元素相乘,dot则是真正矩阵乘法。另外,多维数组也支持子操作,如a *= 2;

其他通用函数

其他通用函数同样可以作用于多维数组/矩阵,如sin,cos,exp,average,cov,ceil, transpose等

all: 测试是否True

Python和Numpy

类似C语言风格,非零即True

soft: 用指定算法对数组进行排序,算法包括了quicksort, mergesort, heapsort等,默认快排序,对于排序算法的性能,参考如下:

Python和Numpy

总体来说,做到了简单,灵活。

Python和Numpy

sort甚至可以对结构化数组进行排序:

Python和Numpy

简直方便到让人流口水。。。

transpose:矩阵转置

Python和Numpy

高阶功能

Broadcasting

Numpy中引入的广播broadcasting用来解决两个形状不同的矩阵阵列如何进行扩展从而可以继续进行数学计算的机制。简单来说,较小的阵列“广播”扩展到较大的阵列相同的形状维度,使得它们可以对等进行输血计算,广播提供过了一种向量化的操作方式,并且Python的广播不需要数据复制,执行效率高效。

具体的广播规则则是让所有输入数组都向其中shape最长的数组看齐,shape中不足的部分都通过在前面加1补齐:

Python和Numpy

同样,在矩阵乘法中:

Python和Numpy

傅立叶变换/分析

傅立叶变换,表示能将满足一定条件的某个函数表示成三角函数或者它们的积分的线性组合,在各个学科中有广泛的应用。

Numpy中包含了标准FFT(一维,一维离散,两维,N维度等),实际FFT等等。这里自动过滤。

下面看一个官网的一维离散傅立叶变换:

Python和Numpy

运行生成的图像为:

Python和Numpy

简单财务函数

Numpy提供了一些简单的金融财务的函数,如计算现值pv,终值fv,贷款利息,收益率等比较基本功能,可以自行查阅API文档。

线性代数

这个应该作为多维数组/矩阵框架的基本款吧?

Python和Numpy

还有其他计算特征值,范数,行列式,以及求解矩阵方程式或线性标量方程组,最小二乘法,求逆等。

我们来看一下我们感兴趣的最小二乘法吧:

lstsq:求解最小二乘解返回到线性矩阵方程

如 求适合直线,y = mx + c

x = [0,     1,    2,    3]

y = [-1, 0.2, 0.9, 2.1]

Python和Numpy

并且可以用简单代码生成拟合图像:

Python和Numpy

运行后,生成如下拟合图:

Python和Numpy

统计/随机抽样

统计与随机分布也是必不可少的函数,包含了随机数据random, sample; 分布beta, binomial, 指数分布,正态分布,泊松分布等等几十种,统计函数如标准方差std,协方差等等。

当然,我们也重点看看我们感(neng)兴(kan)趣(dong)的正态/高斯分布吧:

random.normal(loc, scale, size): 高斯分布绘制随机样本

请自行查阅维基百科:http://en.wikipedia.org/wiki/Normal_distribution

我们来看一下吧:

Python和Numpy

生成的图形如下:

Python和Numpy