sift算法_单应性Homograph估计：从传统算法到深度学习

点击上方“CVer”，选择加"星标"置顶

重磅干货，第一时间送达

本文作者：白裳

https://zhuanlan.zhihu.com/p/74597564

本文已由原作者授权，不得擅自二次转载

单应性原理被广泛应用于图像配准，全景拼接，机器人定位SLAM，AR增强现实等领域。这篇文章从基础图像坐标知识系为起点，讲解图像变换与坐标系的关系，介绍单应性矩阵计算方法，并分析深度学习在单应性方向的进展。

本文为入门级文章，希望能够帮助读者快速了解相关内容。

目录

一图像变换与平面坐标系的关系

二平面坐标系与齐次坐标系

三单应性变换

四深度学习在单应性方向的进展

sift算法_单应性Homograph估计：从传统算法到深度学习

单应性估计在图像拼接中的应用

一图像变换与平面坐标系的关系

旋转：

将图形围绕原点

sift算法_单应性Homograph估计：从传统算法到深度学习

逆时针方向旋转

sift算法_单应性Homograph估计：从传统算法到深度学习

角，用解析式表示为：

sift算法_单应性Homograph估计：从传统算法到深度学习

旋转

写成矩阵乘法形式：

sift算法_单应性Homograph估计：从传统算法到深度学习

平移：

sift算法_单应性Homograph估计：从传统算法到深度学习

平移

sift算法_单应性Homograph估计：从传统算法到深度学习

但是现在遇到困难了，平移无法写成和上面旋转一样的矩阵乘法形式。所以引入齐次坐标

sift算法_单应性Homograph估计：从传统算法到深度学习

，再写成矩阵形式：

sift算法_单应性Homograph估计：从传统算法到深度学习

其中

sift算法_单应性Homograph估计：从传统算法到深度学习

表示单位矩阵，而

sift算法_单应性Homograph估计：从传统算法到深度学习

表示平移向量。

那么就可以把把旋转和平移统一写在一个矩阵乘法公式中，即刚体变换：

sift算法_单应性Homograph估计：从传统算法到深度学习

而旋转矩阵

sift算法_单应性Homograph估计：从传统算法到深度学习

是正交矩阵(

sift算法_单应性Homograph估计：从传统算法到深度学习

)。

sift算法_单应性Homograph估计：从传统算法到深度学习

刚体变换：旋转+平移(正方形-正方形)

仿射变换

sift算法_单应性Homograph估计：从传统算法到深度学习

其中

sift算法_单应性Homograph估计：从传统算法到深度学习

可以是任意2x2矩阵(与

sift算法_单应性Homograph估计：从传统算法到深度学习

一定是正交矩阵不同)。

sift算法_单应性Homograph估计：从传统算法到深度学习

仿射变换(正方形-平行四边形)

可以看到，相比刚体变换(旋转和平移)，仿射变换除了改变目标位置，还改变目标的形状，但是会保持物体的“平直性”。

不同

sift算法_单应性Homograph估计：从传统算法到深度学习

和

sift算法_单应性Homograph估计：从传统算法到深度学习

矩阵对应的各种基本仿射变换：

sift算法_单应性Homograph估计：从传统算法到深度学习

投影变换(单应性变换)

sift算法_单应性Homograph估计：从传统算法到深度学习

投影变换(正方形-任意四边形)

简单说，投影变换彻底改变目标的形状。

总结一下：

刚体变换：平移+旋转，只改变物体位置，不改变物体形状
仿射变换：改变物体位置和形状，但是保持“平直性”
投影变换：彻底改变物体位置和形状

sift算法_单应性Homograph估计：从传统算法到深度学习

注：上图“投影变换”应该是“任意四边形”

我们来看看完整投影变换矩阵各个参数的物理含义：

sift算法_单应性Homograph估计：从传统算法到深度学习

其中

sift算法_单应性Homograph估计：从传统算法到深度学习

代表仿射变换参数，

sift算法_单应性Homograph估计：从传统算法到深度学习

代表平移变换参数。

而

sift算法_单应性Homograph估计：从传统算法到深度学习

表示一种“变换后边缘交点“关系，如：

sift算法_单应性Homograph估计：从传统算法到深度学习

至于

sift算法_单应性Homograph估计：从传统算法到深度学习

则是一个与

sift算法_单应性Homograph估计：从传统算法到深度学习

二平面坐标系与齐次坐标系

问题来了，齐次坐标到底是什么？

齐次坐标系

sift算法_单应性Homograph估计：从传统算法到深度学习

与常见的三维空间坐标系

sift算法_单应性Homograph估计：从传统算法到深度学习

不同，只有两个自由度：

sift算法_单应性Homograph估计：从传统算法到深度学习

而

sift算法_单应性Homograph估计：从传统算法到深度学习

(其中

sift算法_单应性Homograph估计：从传统算法到深度学习

)对应坐标

sift算法_单应性Homograph估计：从传统算法到深度学习

和

sift算法_单应性Homograph估计：从传统算法到深度学习

的缩放尺度。当

sift算法_单应性Homograph估计：从传统算法到深度学习

时：

sift算法_单应性Homograph估计：从传统算法到深度学习

特别的当

sift算法_单应性Homograph估计：从传统算法到深度学习

时，对应无穷远：

sift算法_单应性Homograph估计：从传统算法到深度学习

三单应性变换

单应性是什么？

此处不经证明的给出：同一个 [无镜头畸变] 的相机从不同位置拍摄 [同一平面物体] 的图像之间存在单应性，可以用 [投影变换] 表示。

注意：单应性成立是有条件的！

sift算法_单应性Homograph估计：从传统算法到深度学习

简单说就是：

sift算法_单应性Homograph估计：从传统算法到深度学习

其中

sift算法_单应性Homograph估计：从传统算法到深度学习
是Left view图片上的点，

sift算法_单应性Homograph估计：从传统算法到深度学习
是Right view图片上对应的点。

那么这个

sift算法_单应性Homograph估计：从传统算法到深度学习
单应性矩阵如何求解呢？

更一般的，每一组匹配点

sift算法_单应性Homograph估计：从传统算法到深度学习

有

sift算法_单应性Homograph估计：从传统算法到深度学习

由平面坐标与齐次坐标对应关系

sift算法_单应性Homograph估计：从传统算法到深度学习

，上式可以表示为：

sift算法_单应性Homograph估计：从传统算法到深度学习

进一步变换为：

sift算法_单应性Homograph估计：从传统算法到深度学习

写成矩阵

sift算法_单应性Homograph估计：从传统算法到深度学习

形式：

sift算法_单应性Homograph估计：从传统算法到深度学习

也就是说一组匹配点

sift算法_单应性Homograph估计：从传统算法到深度学习

可以获得2组方程。

单应性矩阵8自由度

注意观察：单应性矩阵

sift算法_单应性Homograph估计：从传统算法到深度学习

与

sift算法_单应性Homograph估计：从传统算法到深度学习

其实完全一样(其中

sift算法_单应性Homograph估计：从传统算法到深度学习

)，例如：

sift算法_单应性Homograph估计：从传统算法到深度学习

即点

sift算法_单应性Homograph估计：从传统算法到深度学习

无论经过

sift算法_单应性Homograph估计：从传统算法到深度学习

还是

sift算法_单应性Homograph估计：从传统算法到深度学习

映射，变化后都是

sift算法_单应性Homograph估计：从传统算法到深度学习

。

如果使

sift算法_单应性Homograph估计：从传统算法到深度学习

，那么有:

sift算法_单应性Homograph估计：从传统算法到深度学习

所以单应性矩阵

sift算法_单应性Homograph估计：从传统算法到深度学习

虽然有9个未知数，但只有8个自由度。

在求

sift算法_单应性Homograph估计：从传统算法到深度学习

时一般添加约束

sift算法_单应性Homograph估计：从传统算法到深度学习

(也有用

sift算法_单应性Homograph估计：从传统算法到深度学习

约束)，所以还有

sift算法_单应性Homograph估计：从传统算法到深度学习

共8个未知数。由于一组匹配点

sift算法_单应性Homograph估计：从传统算法到深度学习

对应2组方程，那么只需要

sift算法_单应性Homograph估计：从传统算法到深度学习

组不共线的匹配点即可求解

sift算法_单应性Homograph估计：从传统算法到深度学习

的唯一解。

sift算法_单应性Homograph估计：从传统算法到深度学习

XIAOMI9拍摄，有镜头畸变

OpenCV已经提供了相关API，代码和变换结果如下。

sift算法_单应性Homograph估计：从传统算法到深度学习

可以看到：

红框所在平面上内容基本对齐，但受到镜头畸变影响无法完全对齐；
平面外背景物体不符合单应性原理，偏离很大，完全无法对齐。

传统方法估计单应性矩阵

一般传统方法估计单应性变换矩阵，需要经过以下4个步骤：

提取每张图SIFT/SURF/FAST/ORB等特征点
提取每个特征点对应的描述子
通过匹配特征点描述子，找到两张图中匹配的特征点对(这里可能存在错误匹配)
使用RANSAC算法剔除错误匹配
求解方程组，计算Homograph单应性变换矩阵

示例代码如下：

#coding:utf-8

sift算法_单应性Homograph估计：从传统算法到深度学习

相关内容网上资料较多，这里不再重复造轮子。需要说明，一般情况计算出的匹配的特征点对

sift算法_单应性Homograph估计：从传统算法到深度学习

数量都有

sift算法_单应性Homograph估计：从传统算法到深度学习

，此时需要解超定方程组(类似于求解线性回归)。

四深度学习在单应性方向的进展

HomographyNet(深度学习end2end估计单应性变换矩阵)

HomographyNet是发表在CVPR 2016的一种用深度学习计算单应性变换的网络，即输入两张图，直接输出单应性矩阵

sift算法_单应性Homograph估计：从传统算法到深度学习

。

sift算法_单应性Homograph估计：从传统算法到深度学习

在之前的分析中提到，只要有4组

sift算法_单应性Homograph估计：从传统算法到深度学习

匹配点即可计算

sift算法_单应性Homograph估计：从传统算法到深度学习

的唯一解。

相似的，只要有4组

sift算法_单应性Homograph估计：从传统算法到深度学习

也可以计算出

sift算法_单应性Homograph估计：从传统算法到深度学习

的唯一解：

sift算法_单应性Homograph估计：从传统算法到深度学习

其中

sift算法_单应性Homograph估计：从传统算法到深度学习

且

sift算法_单应性Homograph估计：从传统算法到深度学习

。

sift算法_单应性Homograph估计：从传统算法到深度学习

分析到这里，如果要计算

sift算法_单应性Homograph估计：从传统算法到深度学习

，网络输出可以有以下2种情况：

Regression：网络直接输出

sift算法_单应性Homograph估计：从传统算法到深度学习
共8个数值

这样设置网络非常直观，使用L2损失训练，测试时直接输出8个float values，但是没有置信度confidence。即在使用网络时，无法知道当前输出单应性可靠程度。

2. Classification：网络输出

sift算法_单应性Homograph估计：从传统算法到深度学习

共8个值的量化值+confidence

这时将网络输出每个

sift算法_单应性Homograph估计：从传统算法到深度学习

和

sift算法_单应性Homograph估计：从传统算法到深度学习

量化成21个区间，用分类的方法判断落在哪一个区间。训练时使用Softmax损失。相比回归直接输出数值，量化必然会产生误差，但是能够输出分类置信度评判当前效果好坏，更便于实际应用。

另外HomographyNet训练时数据生成方式也非常有特色。

首先在随机

sift算法_单应性Homograph估计：从传统算法到深度学习
位置获取正方形图像块Patch A
然后对正方形4个点进行随机扰动，同时获得4组

sift算法_单应性Homograph估计：从传统算法到深度学习
再通过4组

sift算法_单应性Homograph估计：从传统算法到深度学习
计算

sift算法_单应性Homograph估计：从传统算法到深度学习
最后将图像通过

sift算法_单应性Homograph估计：从传统算法到深度学习
变换，在变换后图像

sift算法_单应性Homograph估计：从传统算法到深度学习
位置获取正方形图像块Patch B

那么图像块A和图像块B作为输入，4组

sift算法_单应性Homograph估计：从传统算法到深度学习

作为监督Label，进行训练

sift算法_单应性Homograph估计：从传统算法到深度学习

可以看到，在无法提取足够特征点的弱纹理区域，HomographyNet相比传统方法确实有一定的优势：

sift算法_单应性Homograph估计：从传统算法到深度学习

Spatial Transformer Networks(直接对CNN中的卷积特征进行变换)

其实早在2015年，就已经有对CNN中的特征进行变换的STN结构。

sift算法_单应性Homograph估计：从传统算法到深度学习

假设有特征层

sift算法_单应性Homograph估计：从传统算法到深度学习

，经过卷积变为

sift算法_单应性Homograph估计：从传统算法到深度学习

，可以在他们之间插入STN结构。这样就可以直接学习到从特征

sift算法_单应性Homograph估计：从传统算法到深度学习

上的点

sift算法_单应性Homograph估计：从传统算法到深度学习

映射到特征

sift算法_单应性Homograph估计：从传统算法到深度学习

对应点

sift算法_单应性Homograph估计：从传统算法到深度学习

的仿射变换。

sift算法_单应性Homograph估计：从传统算法到深度学习

其中

sift算法_单应性Homograph估计：从传统算法到深度学习

对应STN中的仿射变换参数。STN直接在特征维度进行变换，且可以插入轻松任意两层卷积中。

DELF: DEep Local Features(深度学习提取特征点与描述子)

之前提到传统方法使用SIFT和Surf等特征点估计单应性。显然单应性最终估计准确度严重依赖于特征点和描述子性能。Google在ICCV 2017提出使用使用深度学习提取特征点。

tensorflow/models/delfgithub.com

sift算法_单应性Homograph估计：从传统算法到深度学习

考虑到篇幅，这里不再展开DELF，请有兴趣的读者自行了解相关内容。

下载1：动手学深度学习

在CVer公众号后台回复：动手学深度学习，即可下载547页《动手学深度学习》电子书和源码。该书是面向中文读者的能运行、可讨论的深度学习教科书，它将文字、公式、图像、代码和运行结果结合在一起。本书将全面介绍深度学习从模型构造到模型训练，以及它们在计算机视觉和自然语言处理中的应用。

sift算法_单应性Homograph估计：从传统算法到深度学习

下载2：CVPR / ECCV 2020开源代码

在CVer公众号后台回复：CVPR2020，即可下载CVPR 2020代码开源的论文合集

在CVer公众号后台回复：ECCV2020，即可下载ECCV 2020代码开源的论文合集

重磅！CVer-论文写作与投稿交流群成立

扫码添加CVer助手，可申请加入CVer-论文写作与投稿微信交流群，目前已满2400+人，旨在交流顶会(CVPR/ICCV/ECCV/NIPS/ICML/ICLR/AAAI等)、顶刊(IJCV/TPAMI/TIP等)、SCI、EI、中文核心等写作与投稿事宜。

同时也可申请加入CVer大群和细分方向技术群，细分方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。

一定要备注：研究方向+地点+学校/公司+昵称(如论文写作+上海+上交+卡卡)，根据格式备注，可更快被通过且邀请进群

sift算法_单应性Homograph估计：从传统算法到深度学习

▲长按加微信群

sift算法_单应性Homograph估计：从传统算法到深度学习

▲长按关注CVer公众号

整理不易，请给CVer点赞和在看！

sift算法_单应性Homograph估计：从传统算法到深度学习

sift算法_单应性Homograph估计：从传统算法到深度学习

一图像变换与平面坐标系的关系

二平面坐标系与齐次坐标系

三单应性变换

其中

sift算法_单应性Homograph估计：从传统算法到深度学习
是Left view图片上的点，

sift算法_单应性Homograph估计：从传统算法到深度学习
是Right view图片上对应的点。

四深度学习在单应性方向的进展

继续阅读

【python】 OSError:sift not found 问题解决

计算机视觉第二章 SIFT地理特征匹配SIFT地理特征匹配SIFT图像匹配地理特征匹配

OpenCV实现SIFT特征提取与匹配

2021年最新解决办法之AttributeError: ‘module‘ object has no attribute ‘xfeatures2d‘

图像特征算法(一)——SIFT算法简述及Python标记SIFT特征检测实践计算机视觉专栏传送

图像特征匹配算法-SIFT算法介绍及代码一、SIFT算法二、SIFT算法代码——python三、备注

基于SIFT特征提取的图像拼接算法matlab仿真

SIFT算法MATLAB实现----尺度空间构造

试试通俗的解释一下SIFT算法一、SIFT是什么？二、SIFT算法步骤总结实验结果

图像处理之特征提取（三）之SIFT简单梳理

sift算法_openCV-SIFT简介（尺度不变特征变换）

[VP] 使用SIFT, HOG和Canny进行图像分类代码SIFT结果HOG 结果Canny结果SIFT, HOG, Canny提取的特征可视化对比

图像特征提取与匹配——SIFT算法图像特征提取与匹配——SIFT算法

SIFT算法详解——图像特征提取与匹配前言一、建立高斯差分金字塔二、关键点(key points)位置确定三、为关键点赋予方向四、构建关键点的描述符总结

sift算法_图像配准SIFT

sift算法_单应性Homograph估计：从传统算法到深度学习

一 图像变换与平面坐标系的关系

二 平面坐标系与齐次坐标系

三 单应性变换

其中 sift算法_单应性Homograph估计：从传统算法到深度学习 是Left view图片上的点， sift算法_单应性Homograph估计：从传统算法到深度学习 是Right view图片上对应的点。

四 深度学习在单应性方向的进展

继续阅读

一图像变换与平面坐标系的关系

二平面坐标系与齐次坐标系

三单应性变换

其中

sift算法_单应性Homograph估计：从传统算法到深度学习
是Left view图片上的点，

sift算法_单应性Homograph估计：从传统算法到深度学习
是Right view图片上对应的点。

四深度学习在单应性方向的进展