https://www.youtube.com/playlist?list=PL8WsPW41L6l7rviIGvIkY0-jn-tM3YSNi
集合S称为凸集(convex set)如果对任意S中的两个点x和y,线段[x,y]全在S内。
函数f:Rn→R是一个凸函数,如果对任意x,y∈Rn以及λ∈[0,1],都满足:
f(λx+(1-λ)y) ≤ λf(x)+(1-λ)f(y)
也就是说,函数在任意两个点之间的secant线(‖切线‖)总在函数图面以上。
绝对值函数 - | x |
凸优化问题是指在某个凸集S上找到一个凸函数f(x)的全局最小值。
即:
min f(x)
s.t. x∈S
其中S是凸集,f(x)是凸函数。
凸优化问题一定存在唯一的全局最小值。
本地最小值一定是全局最小值。
Karush-Kuhn-Tucker条件是必要充分条件来判断一个点是否是解。
线性规划:对象函数和约束函数都是线性的。
二次规划:对象函数是二次的,但约束函数可以是线性的或二次的。
支持向量机:描述间隔最大化问题。
最优控制:描述动态系统在给定期间的最优路径问题。
利用KKT条件构建对偶问题。
应用算法:梯度下降法,牛顿法,内点法等。
针对特定问题设计更高效的定製算法。
将非凸问题分解或近似为一系列子凸优化问题求解。
对一个凸优化问题min f(x),s.t. g(x)≤0,其对偶问题定义为:
max q(y)
where q(y) = inf_{x} [f(x) + y^T g(x)]
这里y是拉格朗日乘子。
如果原问题可行,对偶问题的解存在。
如果原问题和对偶问题都有内点,原问题和对偶问题的最优值相等。
拉格朗日乘子的选择使得原问题的KKT条件等价于对偶问题的KKT条件。
对于max c^Tx, s.t. Ax ≤ b的线性规划问题:
其对偶问题是min b^Ty, s.t. A^Ty ≥ c
构造比原问题更容易解决的对偶问题
应用对偶性质检验原问题特性,如可行性和有界性
采用对偶间隔概念设计支持向量机模型
证明优
逼近问题是找到一个简单函数来近似描述复杂函数或数据的曲线。
找到使残差平方和最小的逼近函数。常用线性、多项式逼近。
添加正则项控制函数复杂程度,避免过拟合。如LASSO、Ridge回归。
使用正交多项式基作为逼近函数空间。
拟合问题是根据已知离散样本点建立连续描述函数。
通过各点附近的多项式重构全局函数,保持连续性和光滑性。
使用径向基函数(RBF)作为本地插值函数,全局插值函数为RBF的线性组合。
使用Bernstein多项式 basic函数定义样条切片,保证全局函数光滑连续。
用未见数据测试逼近效果,根据RMSE、R-square等度量指标评价模型优劣。
根据样本数据估计整体分布或参数。
用样本统计量(平均值、中位数等)作为参数估计值。
平均值估计波动最小,但需要样本大小足够大。
中位数估计不容易被差值点影响,比较稳定。
根据样本和置信度给出参数的可能范围。
普通区间:参数落在该区间的概率是1-α。
最细区间:保证包含真参数的可能性最大。
选择使样本机率最大的模型参数作为估计值。对多参数分布起作用。
利用先验分布与似然函数给出后验分布,其分位数作为估计值及区间。
偏差:估计值期望与真值差异。
方差:估计值与其期望间差异。
误差:估计值与真值间差异。
要求偏差小,方差小作为一个好的统计估计。
一阶方法:利用函数梯度信息,如梯度下降法
二阶方法:利用函数值和梯度的一阶和二阶导数,如牛顿法、BFGS法
etc.
等式限制优化问题是在满足某些等式约束的条件下求解凸函数的最小值。
将等式约束引入对象函数,构建相当于无约束的问题。
将整个问题分解成子问题依次求解,利用子问题解更新全局解。
构建拉格朗日函数,利用KKT条件求原问题与对偶问题的联合解。
迭代算法在每步保留等式约束,求解次优化子问题得到解的一部分。
在每步允许小幅度违反等式约束,迭代收敛时满足等式约束。
利用等式结构约束信息,求解等式约束生根子空间内的牛顿方程。
线性等式约束问题可直接求解,非线性问题常用迭代法收敛到解处。
内点方法是一类求解凸优化问题的迭代算法,它在每一步迭代都保持在可行区域内部运行。
将非等式约束引入拉格朗日函数形成优化障碍函数
每步搜索障碍函数的内点极小点
通过中心路径方法,保证迭代点呈指数型收敛至边界
每步都避免直接考虑约束可满,收敛速度快
需要解决密集矩阵系统方程
适用于中小规模线性和混合整数设计问题
常用的有内点法、向边界点法等
路径跟踪法控制迭代过程
每步可使用LU分解或 condoms 清晰法等解方程组
运筹优化问题如交通、生产调度等
结构优化与机械 Detail 设计
图像处理与模式识别中的凸优化问题
混合整数非线性程序