罚函数法总结

2021-11-13 14:50:27

处理有约束的优化问题时，一种常见的处理方法是: 将约束条件作为惩罚项加到目标函数中。"惩罚"是一个很形象的称呼，意思是优化过程迭代到约束条件之外时给与惩罚，或者说负反馈。例如，我们在处理最小化函数值

f时，在f中增加一些项，这些项会使得迭代点在可行域之外时，增大函数f的值，这些项就起到了惩罚的作用

这些约束条件可以是等式，也可以是不等式，又或者是两者都有。

在处理等式约束时，常常使用外点罚函数法，意思是迭代点允许在可行域之外(其实非常自然，因为等式约束是一种"很严格"的约束，迭代不要限制地太紧了，不然都不好迭代优化);对于不等式约束，常使用内点罚函数法，意思是不让迭代点到可行域之外。内点法适用于只有不等式约束的问题。在对函数添加罚函数后，就将有约束的优化问题转换为了无约束优化问题。

外点罚函数法

等式约束外点罚函数法

考虑问题

min

⁡

(

)

∈

\min_x f(x) \quad x\in \mathbb{R^n}\\ s.t. \ \ c_i(x)=0 \ \ i \in \mathcal E

xminf(x)x∈Rns.t. ci(x)=0 i∈E

最自然的想法，把约束条件的平方作为罚函数，即

∑

P_E(x, \sigma)=f(x)+\frac{1}{2}\sigma \sum_i c_i^{2}(x)

PE(x,σ)=f(x)+21σi∑ci2(x)

其中第二项为惩罚项，sigma称为罚因子。这种方法称为等式约束的二次外点罚函数法。其迭代过程与收敛性的证明参考文在文的《最优化计算方法》P186

上面我们说，外点罚函数法常用于处理等式约束，但如果通过巧妙的设计，也可以用于不等式约束，例如对于如下问题

不等式约束外点罚函数法

min

≤

\min_x f(x) \quad x\in \mathbb{R^n}\\ s.t. \ \ c_i(x)\le0 \ \ i \in \mathcal I

xminf(x)x∈Rns.t. ci(x)≤0 i∈I

将二次罚函数设定为如下样式

max

⁡

\tilde c_i(x)=\max (x_i(x),0)

c~i(x)=max(xi(x),0)

那么有

P_I(x, \sigma)=f(x)+\frac{1}{2}\sigma \sum_i \tilde c_i^{2}(x)

PI(x,σ)=f(x)+21σi∑c~i2(x)

可见，此时也允许迭代点在可行域之外迭代。值得注意的是，

P_I

PI仍然是可导函数，进而可以用梯度类算法求解。

同时含有等式约束与不等式约束的外点罚函数法

对于如下问题

\min_x f(x) \quad x\in \mathbb{R^n}\\ s.t. \ \ c_i(x)\le0 \ \ \ i\in \mathcal I \\ \tilde c_i(x)= 0 \ \ \ i\in \mathcal E

xminf(x)x∈Rns.t. ci(x)≤0 i∈Ic~i(x)=0 i∈E

把两个罚函数相加即可

P(x, \sigma)=f(x)+\frac{1}{2}\sigma (\sum_i c_i^{2}(x) + \sum_i \tilde c_i^{2}(x))

P(x,σ)=f(x)+21σ(i∑ci2(x)+i∑c~i2(x))

内点罚函数法

参考

《最优化计算方法》文再文
《凸优化》Stephen Boyd

罚函数法总结

等式约束外点罚函数法

不等式约束外点罚函数法

同时含有等式约束与不等式约束的外点罚函数法

继续阅读

Codeforces 1417 D. Make Them Equal(思维+构造)

查找算法之二分查找查找算法之二分查找

查找算法学习之二分查找（Python版本）——BinarySearch

CQ V1.0分词bates(基于双数组tire树)—应该是目前最快的中文分词算法

Command Network(POJ 3164)---定根最小树形图模板题题目描述输入格式输出格式输入样例输出样例分析源程序

开源低带宽语音编解码器

241 Different Ways to Add Parentheses（C代码版）

【趋高机器视觉】机器视觉技术原理解析及解决方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制规程及特点4． CSMA/CD协议5． CSMA/CD的优点6．结束语

极大似然法(ML)与最大期望法(EM)

C++ 第十五周报告1--《冒泡法排序》

笔试面试题目：滑动窗口(二)

数据结构与算法（27）——排序（二）

Dijkstra--简易版（最短路径）

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

hdu7108哈希