python-opencv学习笔记（一）

2018-02-11 23:50:00

谷歌大热的深度学习框架tensorflow，虽然也有C的接口，但用的比较多而且较方便的还是基于python的接口，在图像处理时用的比较多的是opencv库，之前一直学的是C语言的接口，为了与tensorflow进行对接，还是有必要看一下opencv的python接口。

基本的I/O脚本：

大多数的CV需要以图像作为输入，同时也会以图像作为输出结果。一个交互式的CV应用程序会议摄像头作为输入源，其他的输入和输出还看是图像文件，视频文件和原始字节（raw byte）。

图像的读写：

OPENCV中的imread（）函数和imwrite（）函数能支持各种静态文件格式，支持BMP、PNG、JPEG和TIFF格式的文件。

接下来是用Python和NumPy来表示一副图片：

无论用那种格式，每一个像素都会有一个值，但不同格式表示像素的方式会不同，如用NumPy数组创建一个黑色的正方形图像：

结果：

每个像素都由一个8位整数老表示，即每个像素值得范围为0~255.

现在用<code>cv2.cvtColor</code>函数将图像转换成RGB格式：

从几个中看出：现在每个像素由三元数组表示，并且每个整形（integer）向量分别表示一个B，G，R通道。其他色彩空间（如HSV）也以同样的表示方式来表示像素，只是取值范围不同（HSV模型表示方式不同），

可以通过shape的属性来查看图像的结构，它会返回行和列。如果一个通道以上会返回通道数：

BGR格式返回了3个通道;

opencv库对图像的转换也非常方便：

只需在imwrite（）时改变图片的后缀就行了，

在默认情况下，即使图像文件为灰度格式，imread（）函数也会返回BGR格式的图像，BGR与RGB所表示的色彩空间相同，但字节顺序相反。下面是可作为imread（）函数的参数：

下面例子是以灰度形式加载图片（这个过程会丢失所有的色彩信息），之后又保持为灰度的PNG图像：

原图像：

转换后的图片：

无论采用哪种模式，imread（）函数会删除所有alpha（透明度）通道的信息。iimwrite（）函数要求图像为BGR或灰度格式，并且每个通道都要有一定bit，输出格式要支持这些通道，例如，bmp格式要求每个通道为8位，而PNG允许每个通道为8位或16位。

继续阅读