SGD(Stochastic Gradient Descent)

SGD(Stochastic Gradient Descent)

作者: 1min111 | 来源:发表于2019-01-24 13:45 被阅读0次

SGD(Stochastic Gradient Descent)
数据挖掘面试总结
ml p5-p7:learning rate，Adagrad，S
gradient descent
DL中的各种优化器
3.线性神经网络 - 随机梯度下降法
sklearn学习笔记——稳健回归分析
深度学习基础2
Stochastic Gradient Descent vs B
机器学习系列（十六）——随机梯度下降Stochastic Gra

随机梯度下降算法

给的参数格式为(这里用numpy数组格式)
[[x11, x12, x13, ..., x1n],  [[y1],
[x21, x22, x23, ..., x2n],   [y2],
...         ...
[xn1, xn2, xn3, ... , xnn]]  [yn]]
给出python代码先，下面会给出原理分析

    def SGD(self, training_data, epochs, mini_batch_size, eta,
            test_data=None):
        if test_data: n_test = len(test_data)
        n = len(training_data)
        for j in xrange(epochs):
            random.shuffle(training_data)
            mini_batches = [
                training_data[k:k+mini_batch_size]
                for k in xrange(0, n, mini_batch_size)]
            for mini_batch in mini_batches:
                self.update_mini_batch(mini_batch, eta)
            if test_data:
                print "Epoch {0}: {1} / {2}".format(
                    j, self.evaluate(test_data), n_test)
            else:
                print "Epoch {0} complete".format(j)

1.设计估计函数

这里假设是多元线性函数，x代表的是特征分量， θ为变量

估计函数

2.计算损失函数J(θ)&偏导

损失函数J(θ)

接下来对损失函数进行求导，由于SGD每次只取一组变量，不用考虑外层的sigma求和，θ的偏导

θ偏导函数

3.根据偏导循环更新θi

这里的α指的是步长，虽然步长一致，但是由于机器学习根据梯度下降的算法基本都是凸函数所以越接近损失函数的最小值每一步走的距离会越来越小，最后两步走的距离接近设定阈值（比如0.0001），算法可认为已经完成了

更新θi

相关文章

SGD(Stochastic Gradient Descent)
随机梯度下降算法给的参数格式为(这里用numpy数组格式)[[x11, x12, x13, ..., x1n],...
数据挖掘面试总结
随机梯度下降三种梯度下降： Gradient Descent(GD)、SGD(stochastic gradie...
ml p5-p7:learning rate，Adagrad，S
概览 p5:learning rate，Adagrad，Stochastic Gradient Descent ，...
gradient descent
讲到了梯度下降的三种基本形式 batch gradient descent stochastic gradient...
DL中的各种优化器
学习笔记 BGD (Batch Gradient Decent)批量梯度下降法 SGD (Stochastic G...
3.线性神经网络 - 随机梯度下降法
随机梯度下降法:stochastic gradient descent 大纲 1. look --- 大数据情况...
sklearn学习笔记——稳健回归分析
1、零碎的概念学习 Stochastic Gradient Descent 随机梯度下降法 Perceptron ...
深度学习基础2
Stochastic Gradient Descent 如何训练神经网络训练神经网络就是调整权重。这里介绍了损...
Stochastic Gradient Descent vs B
梯度下降是最小化风险函数/损失函数的一种经典常见的方法，下面总结下三种梯度下降算法异同。 1、批量梯度下降算法（...
机器学习系列（十六）——随机梯度下降Stochastic Gra
随机梯度下降法Stochastic Gradient Descent 在之前的梯度下降法解决线性回归问题中，梯度向...

网友评论

本文标题：SGD(Stochastic Gradient Descent)

本文链接：https://www.haomeiwen.com/subject/dwryjqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|SGD(Stochastic Gradient Descent)|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！