无约束优化方法-直接方法（坐标轮换法）

作者: oskor | 来源:发表于2019-03-03 16:07 被阅读0次

无约束优化方法-直接方法（坐标轮换法）
无约束优化方法-直接方法（Downhill Simplex）
无约束优化方法-直接方法（Powell与改进Powell）
无约束优化方法-一阶导数（最速下降法）
04 最优化方法
手撕梯度下降法——原理篇
梯度下降
Newton's method and Quasi Ne
机器学习之梯度下降
非线性最优化方法——直接方法

无约束最优化方法的一般步骤可以总结如下：

选择初始点 $\boldsymbol{x}_0$ ，这一点越靠近局部极小点 $\boldsymbol{x}^*$ 越好；

已取得某设计点 $\boldsymbol{x}_k$ ，选择一个设计方向 $\boldsymbol{d}_k$ ，沿此方向搜索，函数值需是下降的， $\boldsymbol{d}_k$ 是下降方向；

从 $\boldsymbol{x}_k$ 出发，沿 $\boldsymbol{d}_k$ 方向进行搜索，确定步长因子 $\lambda_k$ ，得到新的设计点 $\boldsymbol{x}_{k+1}$ ， $\boldsymbol{x}_{k+1}=\boldsymbol{x}_k+\lambda_k\boldsymbol{d}_k$ 并满足 $f(\boldsymbol{x}_{k+1})<f(\boldsymbol{x}_k)$ ，具有这种性质的算法，称为下降算法。 $\lambda_k$ 可以由一维搜索方法来确定最优步长因子；

若新点 $\boldsymbol{x}_{k+1}$ 满足迭代计算终止条件，则停止迭代， $\boldsymbol{x}_{k+1}$ 作为 $\boldsymbol{x}^*$ ，否则返回2步继续迭代搜索。

可以看出无约束优化算法的关键几点：初始值，方向设计，步长因子，终止条件。其中搜索方向是各种无约束方法的主要特征。

无约束优化法可以通过有无使用梯度信息分为直接法和间接方法。其中，直接法，即只需要计算，比较函数值来确定迭代方向和步长的方法。其优点是不需要函数有较好的解析性质。适用范围广，可靠性较高。而在工程实际中，函数形式往往比较复杂，不易求导数，直接法比较适合采用。缺点相对利用导数信息的间接法收敛速度慢。

坐标轮换法

坐标（变量）轮换法是最简单最易理解的直接方法。其由D‘esopo于1959年提出，其基本思想是把含有n个变量的优化问题轮换转为单变量的优化问题，即每次沿某一个坐标轴进行一维搜索的问题。算法步骤：

已知目标函数 $f(\boldsymbol{x})$ ，终止限 $\varepsilon>0$ .

任选取初始点 $\boldsymbol{x}_0$ 作为第一轮迭代的初始点， $\varepsilon>0$ ;

置搜索方向依次为：
$\boldsymbol{e}_1 = [1,0,0,...,0]^T$
$\boldsymbol{e}_2 = [0,1,0,...,0]^T$
$......$
$\boldsymbol{e}_n = [0,0,0,...,1]^T$

按照下式求最优步长并进行迭代计算：
$f(\boldsymbol{x}_k^{i-1}+t_k^i\boldsymbol{e}_i)=\min_tf(\boldsymbol{x}_k^{i-1}+t\boldsymbol{e}_i),\boldsymbol{x}_k^i=\boldsymbol{x}_k^{i-1}+t_k^i\boldsymbol{e}_i$

如果 $i=n$ ，即转第5步，如果 $i<n$ ，则转第3步；

收敛性准则为 $||\boldsymbol{x}_k^n-\boldsymbol x_{k-1}^n || \leq \varepsilon$ ，如满足迭代终止条件，停止迭代，输出最优解 $\boldsymbol{x}^*=\boldsymbol{x}_k^n$ ；若不满足，则令 $k=k+1$ 转到第3步。

Algorithm 1 坐标轮换法

function [x_min,f_min] = CoordinateRotationMethod(func,x0,options)

if nargin<3
    options.tol = 1e-12;
    options.iterNum = 1000;
    options.bracketMethod = '';
    options.linearSrcMethod = '';
    options.plot2.Flag = 0;
    options.plot2.x = [];
    options.plot2.y = [];
    options.plot2.z = [];  
end
tol = options.tol;
iterNum = options.iterNum;

plot2 = options.plot2;
if length(x0)~=2
    plot2.Flag = 0;
end

x_min = x0;
f_min = func(x0);

E = eye(length(x0));
xk = x0; 

f_pre = func(xk);
f = f_pre+1e10;

if plot2.Flag == 1 
    figure,subplot(1,2,1),axis equal, hold on;
    contourf(plot2.x,plot2.y,plot2.z,30,'linestyle','-')
    colormap('jet');
    tempf =f_pre;
end

while(iterNum)
    for i=1:1:length(x0) 
        d = E(:,i);
        lamdaFuncH = @(lamda)(func(xk+lamda.*d));
        [a,b,c] = bracketAdvanceBack(lamdaFuncH,0,0.01);
        lamda = GoldSection(lamdaFuncH,a,c,1e-12);
        xk1 = xk + lamda.*d;
        f =func(xk1);
        if plot2.Flag == 1 
            tempf = [tempf,f];
            subplot(1,2,1),plot([xk(1),xk1(1)],[xk(2),xk1(2)],'-ro','LineWidth',2);
            subplot(1,2,2),plot(tempf,'-b.','LineWidth',2); grid on;
            axis([0,60,0,func(x0)]);
            xlabel('Step');
            ylabel('Objective Function Value');
            pause(0.1)
        end
        xk = xk1;
        iterNum = iterNum - 1;
    end
    if abs(f-f_pre)<tol||iterNum == 0
            x_min = xk;
            f_min = f;
            break;
    else
        f_pre = f;
    end        
end

坐标轮换法逻辑简单，易于掌握，但计算效率低，对维数较高的优化问题更为突出，通常用于低维优化问题；此外，这种方法的收敛效果很大程度上取决于目标函数的等值线的形状：

$\bullet$ 等值线为椭圆族,其长短轴与坐标轴平行时，收敛很快，即 $\boldsymbol{x}$ 的维度步数即可收敛;
$\bullet$ 当椭圆族的长短轴与坐标轴斜交时，迭代次数将大大增加，收敛速度慢;
$\bullet$ 当目标函数等值线出现“脊线”时,沿坐标轴方向搜索不能使得函数值有所下降,坐标轮换法在求优过程中将失败,这类函数对于坐标轮换法就是病态函数。

图1 坐标轮换法与优化问题等值线的关系

无约束优化方法-直接方法（坐标轮换法）
无约束最优化方法的一般步骤可以总结如下：选择初始点，这一点越靠近局部极小点越好；已取得某设计点，选择一个设计方向...
无约束优化方法-直接方法（Downhill Simplex）
Downhill simplex 方法又称为Nelder-Mead算法、Amoeba方法，由Spendley、He...
无约束优化方法-直接方法（Powell与改进Powell）
在坐标轮换法中，可知其收敛速度慢，且受到等值线的形状的影像。原因可归结为其搜索方向总是平行于坐标轴，不适应函数的变...
无约束优化方法-一阶导数（最速下降法）
利用导数信息的方法皆为间接方法。在无约束优化法最开始介绍时，提到迭代形式的优化方法关键步骤是确定搜索方向和步长。间...
04 最优化方法
推荐书籍：《最优化方法》李元科基本概念：目标函数无约束优化约束优化迭代下降法 1）图解法： 2）迭...
手撕梯度下降法——原理篇
梯度下降法（Gradient Descent，GD）是一种常用的求解无约束最优化问题的方法，在最优化、统计学以及机...
梯度下降
梯度下降（Gradient Descent）是在求解机器学习算法的模型参数（无约束优化问题）时，最常采用的方法之一...
Newton's method and Quasi Ne
Welcome To My Blog 牛顿法和拟牛顿法是求解无约束最优化问题的常用方法,优点是收敛速度快.牛顿法...
机器学习之梯度下降
梯度下降法是求解无约束最优化问题的一种常用的方法，方法实现简单。梯度下降背后的思想是：开始时我们随机选择一个参数的...
非线性最优化方法——直接方法
非线性最优化的直接方法指的是仅仅利用函数值而不需要导数的方法。在实际问题中我们遇到的目标函数表达式有时会非常复杂或...