美文网首页
无约束优化方法-直接方法(坐标轮换法)

无约束优化方法-直接方法(坐标轮换法)

作者: oskor | 来源:发表于2019-03-03 16:07 被阅读0次

无约束最优化方法的一般步骤可以总结如下:

  1. 选择初始点\boldsymbol{x}_0,这一点越靠近局部极小点\boldsymbol{x}^*越好;
  2. 已取得某设计点\boldsymbol{x}_k,选择一个设计方向\boldsymbol{d}_k,沿此方向搜索,函数值需是下降的,\boldsymbol{d}_k是下降方向;
  3. \boldsymbol{x}_k出发,沿\boldsymbol{d}_k方向进行搜索,确定步长因子\lambda_k,得到新的设计点\boldsymbol{x}_{k+1}\boldsymbol{x}_{k+1}=\boldsymbol{x}_k+\lambda_k\boldsymbol{d}_k并满足f(\boldsymbol{x}_{k+1})<f(\boldsymbol{x}_k),具有这种性质的算法,称为下降算法。\lambda_k可以由一维搜索方法来确定最优步长因子;
  4. 若新点\boldsymbol{x}_{k+1}满足迭代计算终止条件,则停止迭代,\boldsymbol{x}_{k+1}作为\boldsymbol{x}^*,否则返回2步继续迭代搜索。

可以看出无约束优化算法的关键几点:初始值,方向设计,步长因子,终止条件。其中搜索方向是各种无约束方法的主要特征。

无约束优化法可以通过有无使用梯度信息分为直接法和间接方法。其中,直接法,即只需要计算,比较函数值来确定迭代方向和步长的方法。其优点是不需要函数有较好的解析性质。适用范围广,可靠性较高。而在工程实际中,函数形式往往比较复杂,不易求导数,直接法比较适合采用。缺点相对利用导数信息的间接法收敛速度慢。

坐标轮换法

坐标(变量)轮换法是最简单最易理解的直接方法。其由D‘esopo于1959年提出,其基本思想是把含有n个变量的优化问题轮换转为单变量的优化问题,即每次沿某一个坐标轴进行一维搜索的问题。算法步骤:

已知目标函数f(\boldsymbol{x}),终止限\varepsilon>0.

  1. 任选取初始点\boldsymbol{x}_0作为第一轮迭代的初始点,\varepsilon>0;
  2. 置搜索方向依次为:
    \boldsymbol{e}_1 = [1,0,0,...,0]^T
    \boldsymbol{e}_2 = [0,1,0,...,0]^T
    ......
    \boldsymbol{e}_n = [0,0,0,...,1]^T
  3. 按照下式求最优步长并进行迭代计算:
    f(\boldsymbol{x}_k^{i-1}+t_k^i\boldsymbol{e}_i)=\min_tf(\boldsymbol{x}_k^{i-1}+t\boldsymbol{e}_i),\boldsymbol{x}_k^i=\boldsymbol{x}_k^{i-1}+t_k^i\boldsymbol{e}_i
  4. 如果i=n,即转第5步,如果i<n,则转第3步;
  5. 收敛性准则为||\boldsymbol{x}_k^n-\boldsymbol x_{k-1}^n || \leq \varepsilon,如满足迭代终止条件,停止迭代,输出最优解\boldsymbol{x}^*=\boldsymbol{x}_k^n;若不满足,则令k=k+1转到第3步。

Algorithm 1 坐标轮换法

function [x_min,f_min] = CoordinateRotationMethod(func,x0,options)

if nargin<3
    options.tol = 1e-12;
    options.iterNum = 1000;
    options.bracketMethod = '';
    options.linearSrcMethod = '';
    options.plot2.Flag = 0;
    options.plot2.x = [];
    options.plot2.y = [];
    options.plot2.z = [];  
end
tol = options.tol;
iterNum = options.iterNum;

plot2 = options.plot2;
if length(x0)~=2
    plot2.Flag = 0;
end

x_min = x0;
f_min = func(x0);

E = eye(length(x0));
xk = x0; 

f_pre = func(xk);
f = f_pre+1e10;

if plot2.Flag == 1 
    figure,subplot(1,2,1),axis equal, hold on;
    contourf(plot2.x,plot2.y,plot2.z,30,'linestyle','-')
    colormap('jet');
    tempf =f_pre;
end

while(iterNum)
    for i=1:1:length(x0) 
        d = E(:,i);
        lamdaFuncH = @(lamda)(func(xk+lamda.*d));
        [a,b,c] = bracketAdvanceBack(lamdaFuncH,0,0.01);
        lamda = GoldSection(lamdaFuncH,a,c,1e-12);
        xk1 = xk + lamda.*d;
        f =func(xk1);
        if plot2.Flag == 1 
            tempf = [tempf,f];
            subplot(1,2,1),plot([xk(1),xk1(1)],[xk(2),xk1(2)],'-ro','LineWidth',2);
            subplot(1,2,2),plot(tempf,'-b.','LineWidth',2); grid on;
            axis([0,60,0,func(x0)]);
            xlabel('Step');
            ylabel('Objective Function Value');
            pause(0.1)
        end
        xk = xk1;
        iterNum = iterNum - 1;
    end
    if abs(f-f_pre)<tol||iterNum == 0
            x_min = xk;
            f_min = f;
            break;
    else
        f_pre = f;
    end        
end

坐标轮换法逻辑简单,易于掌握,但计算效率低,对维数较高的优化问题更为突出,通常用于低维优化问题;此外,这种方法的收敛效果很大程度上取决于目标函数的等值线的形状:

\bullet 等值线为椭圆族,其长短轴与坐标轴平行时,收敛很快,即\boldsymbol{x}的维度步数即可收敛;
\bullet 当椭圆族的长短轴与坐标轴斜交时,迭代次数将大大增加,收敛速度慢;
\bullet 当目标函数等值线出现“脊线”时,沿坐标轴方向搜索不能使得函数值有所下降,坐标轮换法在求优过程中将失败,这类函数对于坐标轮换法就是病态函数。

图1 坐标轮换法与优化问题等值线的关系

相关文章

网友评论

      本文标题:无约束优化方法-直接方法(坐标轮换法)

      本文链接:https://www.haomeiwen.com/subject/teopuqtx.html