天天看点

二次范数的最速下降方法理解与分析

最近在看Stephen Boyd的《凸优化》,对其中采用二次范数的最速下降方法,书中给出了基于坐标变换的推导,简单易懂,本文给出的是从定义的角度推导的过程,现分析如下,本人水平有限,如有错误,欢迎指正!

首先对二次范数的定义和对偶范数进行说明

1. 二次范数的定义

对于

二次范数的最速下降方法理解与分析

,P的二次范数如下:

二次范数的最速下降方法理解与分析

推导如下:

二次范数的最速下降方法理解与分析

2. 二次范数的对偶范数

二次范数的最速下降方法理解与分析

即是:

二次范数的最速下降方法理解与分析
二次范数的最速下降方法理解与分析

其中

二次范数的最速下降方法理解与分析

,那么

二次范数的最速下降方法理解与分析

,其中

二次范数的最速下降方法理解与分析

二次范数的最速下降方法理解与分析

对于给定的z和P,

二次范数的最速下降方法理解与分析

方向大小已定,要使上式內积最大,

二次范数的最速下降方法理解与分析

要和

二次范数的最速下降方法理解与分析

方向一致,且

二次范数的最速下降方法理解与分析

取最大值为1,也就是说

二次范数的最速下降方法理解与分析

二次范数的最速下降方法理解与分析

的方向向量时,內积最大,为

二次范数的最速下降方法理解与分析

3. 二次范数的规范化的最速下降方法

二次范数的最速下降方法理解与分析
二次范数的最速下降方法理解与分析

注意:

二次范数的最速下降方法理解与分析

就是二次范数的对偶范数,可知当

二次范数的最速下降方法理解与分析

二次范数的最速下降方法理解与分析

的方向向量时,內积最大,求出此时的v,便是argmax的最优值。

二次范数的最速下降方法理解与分析

二次范数的最速下降方法理解与分析

的方向向量,有以下式子成立:

二次范数的最速下降方法理解与分析
二次范数的最速下降方法理解与分析

那么:

二次范数的最速下降方法理解与分析

最后最速下降法的步径如下:

二次范数的最速下降方法理解与分析
二次范数的最速下降方法理解与分析

4. 《凸优化》中用坐标变换的角度来说明,更易理解,现附录如下:

对于采用P范数的最速下降法,它有一个有意义的解释:它是对原问题进行某种坐标变换后的梯度下降法。定义

二次范数的最速下降方法理解与分析

,因此

二次范数的最速下降方法理解与分析

。采用这种变换,原目标函数的最小化问题可以转化为极小化下式给出的目标函数

二次范数的最速下降方法理解与分析

二次范数的最速下降方法理解与分析

采用梯度方法的优化

二次范数的最速下降方法理解与分析

,在点

二次范数的最速下降方法理解与分析

处的直线搜索方向为:

二次范数的最速下降方法理解与分析

通过坐标变换再变回去:

二次范数的最速下降方法理解与分析

参考:《凸优化》王书宁等译

继续阅读