美文网首页深度学习
利用K折验证来验证你的方法

利用K折验证来验证你的方法

作者: 庵下桃花仙 | 来源:发表于2019-03-19 22:48 被阅读0次

使用K折的原因:

在调节网络参数时,需要将数据划分为训练集和验证集。有时候,验证集较小,在我们划分不同的训练集和验证集时,会造成验证分数上有很大的方差。因此,最佳做法是,使用K折交叉验证。
K折交叉验证:将数据划分为 K 个分区(通常为4或5),实例化 K 个模型,每个模型在 K-1 个分区上进行训练,并在下一个分区进行评估。则模型的验证分数为 K 个验证分数的平均值。


3 折交叉验证.PNG

np.concatenate表示数组拼接

import numpy as np
x = [[1, 2],
     [3, 4]]
x1 = np.concatenate([x, x], axis=0)
x2 = np.concatenate([x, x], axis=1)
print(x)
print(x1)
print(x2)
[[1, 2], [3, 4]]
[[1 2]
 [3 4]
 [1 2]
 [3 4]]
[[1 2 1 2]
 [3 4 3 4]]

k 折验证

import numpy as np

k = 4 # 4折
num_val_sample = len(train_data) // 4
num_epochs = 100
all_scores = []

for i in range(k):
    print('processing fold #', i)
    # 准备验证数据,第k个分区的数据
    val_data = train_data[i * num_val_sample: (i + 1) * num_val_sample]
    val_targets = train_targets[i * num_val_sample: (i + 1) * num_val_sample]

    # 准备训练数据:其它所有分区的数据
    partial_train_data = np.concatenate([train_data[:i * num_val_sample],
                                         train_data[(i + 1) * num_val_sample:]],
                                        axis=0)
    partial_train_targets = np.concatenate([train_targets[:i * num_val_sample],
                                         train_targets[(i + 1) * num_val_sample:]],
                                        axis=0)

    model = build_model() # 构建Keras模型(已编译)
    model.fit(partial_train_data, partial_train_targets,
              epochs=num_epochs, batch_size=1, verbose=0) # 训练模型(静默模式,verbose=0)
    val_mse, val_mae = model.evaluate(val_data, val_targets, verbose=0) # 在验证数据上评估模型
    all_scores.append(val_mae)

print(all_scores)
print(np.mean(all_scores))
processing fold # 0
2019-03-20 21:48:12.341884: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2
processing fold # 1
processing fold # 2
processing fold # 3
[2.0433454017828008, 2.265371648391875, 2.940860136900798, 2.3155297182574133]
2.3912767263332215

表明预测的房价与实际价格平均相差2400美元,而实际10000到50000美元,差别还是挺大的。

verbose:日志显示
verbose = 0 为不在标准输出流输出日志信息
verbose = 1 为输出进度条记录
verbose = 2 为每个epoch输出一行记录
注意: 默认为 1
(https://www.jianshu.com/p/159a9ac413fa)

相关文章

  • 利用K折验证来验证你的方法

    使用K折的原因: 在调节网络参数时,需要将数据划分为训练集和验证集。有时候,验证集较小,在我们划分不同的训练集和验...

  • 深度学习知识点汇总-机器学习基础(15)

    2.15 交叉验证和k折交叉验证 交叉验证是为了提高模型的泛华能力。 方法主要有: 留一交叉验证 k折交叉验证 这...

  • 打卡2020-02-19

    K折交叉验证 由于验证数据集不参与模型训练,当训练数据不够用时,预留大量的验证数据显得太奢侈。一种改善的方法是K折...

  • 如何进行变量筛选和特征选择(三)?交叉验证

    01 模型简介 交叉验证是机器学习中常用的一种验证和选择模型的方法,常用的交叉验证方法是K折交叉验证。将原始数据...

  • K折验证

    K折验证(K-fold validation)将数据划分为K个分区。对每个分区 i,在剩余的 K-1 个分区上训练...

  • 机器学习(交叉验证)2020-09-17

    小言 天气:阴 凉爽 K折验证 和 留一法 知识点 1)K折交叉验证 所以总结来看,交叉验证还是一个比较复杂的过程...

  • 第7章 模型评估

    7.2 k折交叉验证模型性能 这个方法可以解决过度适应的问题, 7.3 e1071包进行交叉验证 tune函数采用...

  • 十一、交叉验证和网格搜索

    1交叉验证 1)评估方法一般有留出法,交叉验证法,自助法,这里我们介绍交叉验证法。2)k折交叉验证法:将数据集D划...

  • Python + sklearn实现交叉验证

    scikit-learn中计算交叉验证的函数: cross_val_score:得到K折验证中每一折的得分,K个得...

  • 机器学习一些代码记录

    计算多分类时的每个类别的F1 接口 示例: pytorch 使用K-折交叉验证 pytorch 使用K-折交叉验证...

网友评论

    本文标题:利用K折验证来验证你的方法

    本文链接:https://www.haomeiwen.com/subject/uyyomqtx.html