美文网首页
坐标下降法

坐标下降法

作者: Andrew_jidw | 来源:发表于2020-03-13 14:46 被阅读0次

首先介绍一个算法:coordinate-wise minimization

问题的描述:给定一个可微的凸函数

,如果在某一点x,使得f(x)在每一个坐标轴上都是最小值,那么f(x)是不是一个全局的最小值。

形式化的描述为:是不是
对于所有的d,i都有 这里

的代表第i个标准基向量。

答案为成立。


这是因为:


但是问题来了,如果对于凸函数f,若不可微该会怎样呢?


答案为不成立,上面的图片就给出了一个反例。

那么同样的问题,现在

,其中g是可微的凸函数,每一个hi都是凸的?

答案为成立。


证明如下,对每一个y


坐标下降(Coordinate descent):

这就意味着,对所有的
,其中g是可微的凸函数,每一个hi都是凸的,我们可以使用坐标下降寻求一个最小值,我们从一个最初的猜想
开始,对k进行循环:
每一次我们解决了

,我们都会使用新的值。

Tseng (2001)的开创性工作证明:对这种f(f在紧集上
连续,且f到达了其最小值),
的极限值,k=1,2,3….是f的一个最小元(minimizer)。

在实分析领域:


随后收敛与x*( Bolzano-Weierstrass)


收敛于f*( monotoneconvergence)

其中:

坐标下降的顺序是任意的,可以是从1到n的任意排列。

可以在任何地方将单个的坐标替代成坐标块

关键在于一次一个地更新,所有的一起更新有可能会导致不收敛

我们现在讨论一下坐标下降的应用:



注:原文链接:https://blog.csdn.net/u013802188/article/details/40476989
学习链接

相关文章

  • 坐标下降法

    首先介绍一个算法:coordinate-wise minimization 问题的描述:给定一个可微的凸函数 ,如...

  • 推荐系统9:MF推荐

    1.LFM推荐 思路和ALS算法类似,区别在于,ALS利用坐标下降法,LFM利用梯度下降法假设: 评分矩阵??,?...

  • 梯度下降法

    梯度下降法 本文主要是为了讲解 梯度下降法 的原理和实践,至于什么是梯度下降法,他能做什么,相信百度一下你就都知道...

  • 学习笔记:两种梯度下降法的思考

    在看梯度下降法的时候最初还真没看明白两种梯度下降法的区别,于是昨天散步的时候认真的思考了一下。 两种梯度下降法分别...

  • 最速梯度下降

    梯度下降法实现简单,当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优解,梯度下降法的...

  • 2020-08-19--梯度下降法01

    梯度下降法简介 多元线性回归中的梯度下降法 随机梯度下降法 梯度下降法 的调试 1.梯度下降法简介 不是一个机器学...

  • 05 主题模型 - 坐标轴下降法

    04 主题模型 - NMF 六、坐标轴下降法 回顾: 当加入L1正则项后,由于没法求解出正常的导函数出来(导函数不...

  • 深度学习讲稿(27)

    5.5 瀑布下降法 我们在没有讲述瀑布下降法(即完全梯度下降法)之前就比较了这个方法和随机梯度下降法的优劣。很多人...

  • 2019-03-17神经网络——optimizer

    神经网络优化算法,通常有三种:小批量梯度下降法,随机梯度下降法和批量梯度下降法。 小批量梯度下降法 适用于训练数据...

  • 2019-11-01第二课二周优化算法

    指数加权平均: 动量梯度下降法: RMSprop:和动量梯度下降法相似 adam优化算法:将动量梯度下降法和RMS...

网友评论

      本文标题:坐标下降法

      本文链接:https://www.haomeiwen.com/subject/fetqshtx.html