美文网首页
深度学习讲稿(27)

深度学习讲稿(27)

作者: 山岳之心 | 来源:发表于2021-03-11 17:57 被阅读0次

5.5 瀑布下降法

我们在没有讲述瀑布下降法(即完全梯度下降法)之前就比较了这个方法和随机梯度下降法的优劣。很多人会觉得丈二金刚摸不着头脑。但是这其实是很必要的。因为其实本质上算法是很严谨细致的东西,其中精妙之处往往隐藏很深,所以就需要细细体会才能理解其中的思想。我们先讲其优劣和应用,再来看算法本身,就会站在上帝视角来看待算法的全貌。否则一旦落入算法代码的汪洋大海,就变成盲人摸象,只能看到算法的某一个角。弱水三千,只取一瓢。至少你要知道三千弱水的不同,然后才能选最喜欢的那一瓢。

下面我们进入瀑布下降法的代码环节。

数据处理部分就不再详述了,这一步和之前的随机梯度下降法是一样的。我们需要用到矩阵按列求平均值的函数,下面就是这个函数的代码:

def matrix_column_avg(mat):
    row,column = mat.shape
    result = np.zeros(column)
    for col in range(column):
        for item in range(row):
            result[col] += mat[item,col]
    result /= row
    return result 

它输入一个矩阵,输出一行的向量,向量中的每一个元素都是输入矩阵的列平均值。另外,我们将每一次的全部数据的梯度下降都打包成一个函数,让它对所有的数据点做一次梯度下降。输出是梯度下降的引擎,梯度下降乘子(它是一个对角矩阵)以及对应于每条数据的误差列表。代码如下:

def excute_grad_desc(data,real_value,weights):
    weight_matrix = np.empty((len(raw_data),len(weights)))
    error_list = []
    for item_index in range(len(data)): 
        # 每个数据条都做一次梯度下降
        # 从第一条数据条开始循环
        inputs = data[item_index]
        outputs = real_value[item_index]
        engine = rand_grad(inputs,outputs,weights)
        gdm = list(engine.grad_descent_multiplier())
        if min(np.abs(gdm)) > max(np.abs(weights)):
            gdm /= 10*min(np.abs(gdm))/max(np.abs(weights))
        # 下降因子相对于权重过大,此时应将它缩小,否则极易引起误差发散。
        factor = np.diag(gdm)
        error_list.append(engine.error_function())
    return engine, factor, error_list

最后是执行整体梯度下降,用单步梯度下降操作之后得到的值计算出平均权重,然后用平均权重当作新的起点进行下一步的梯度下降。这样就可以用一个循环来执行,即:

for t in range(100): # 梯度下降的下降次数
    engine, factor, error_list = excute_grad_desc(raw_data,sell_price,weights)
    weights -= np.matmul(learning_rate,factor)
    weight_matrix[item_index] = weights
    # 求平均值,并把它看作是新的权重
    weights = matrix_column_avg(weight_matrix)

print("最终的权重:", weights)
# 验证权重的有效性, 再执行一次
engine, factor, error_list = excute_grad_desc(raw_data,sell_price,weights)
print("误差列表:", error_list)

最终我们会看到如下的结果:

最终的权重: [1.46239029 0.51211936 1.39663107 1.10692271]
误差列表: [8.17836538021409e-05, 0.0044868083148646085, 0.0037373692234452895, 0.007409998180022533, 0.0014975302720826947, 0.0076731972041592005]

相关文章

  • 深度学习讲稿(27)

    5.5 瀑布下降法 我们在没有讲述瀑布下降法(即完全梯度下降法)之前就比较了这个方法和随机梯度下降法的优劣。很多人...

  • 深度学习讲稿(2)

    1.4 深度学习的当前应用 目前,深度学习已经和商业结合得非常多。这个算法本身已经深刻地改变了人类社会,而且在未来...

  • 深度学习讲稿(1)

    深度学习 I. 从AlphaGo谈起 大家听说过2015年10月, 英国DeepMind设计的人工智能AlphaG...

  • 深度学习讲稿(4)

    第2章: 基本概念 本章主要内容: 什么是深度学习、机器学习和人工智能? 什么是参数模型和非参数模型? 什么是监督...

  • 深度学习讲稿(5)

    2.3 监督机器学习 监督学习对数据集进行转换 监督学习是一种将一个数据集转换成另一个数据集的方法。例如,如果你有...

  • 深度学习讲稿(7)

    2.6 监督参数学习 简化描述:使用旋钮进行试错学习 监督参数学习机是一台具有固定数量的旋钮(参数)的机器,通过转...

  • 深度学习讲稿(6)

    2.5 参数学习和非参数学习 简化表述:试错学习 VS. 计数和概率。前面谈的内容将所有的机器学习算法分成两组:有...

  • 深度学习讲稿(3)

    1.5 准备工作 安装jupyter Notebook 和 Numpy Python 库强烈建议安装VScode...

  • 深度学习讲稿(8)

    2.7 无监督参数学习 无监督参数学习本质上是对数据进行分类,但是在数据分类之前已经对该数据有一定的标记。比如淘金...

  • 深度学习讲稿(25)

    5.3 随机梯度下降法 我们首先来看随机梯度下降法的运算顺序。前面我们已经讲了这种算法的学习逻辑。它对整个数据集要...

网友评论

      本文标题:深度学习讲稿(27)

      本文链接:https://www.haomeiwen.com/subject/cwdoqltx.html