看了几个大佬的数据集划分总觉得有些可能是后期进行过修改的,于是决定先用最简单的数据集划分方式,如下图:
滑窗法以增加样本(修改:所有特征区间改为feature窗口,预测区间改为label窗口。feature区间-2取02/01-05/31,label窗口-2取06/01-06/30)
负样本数量:977900
正样本数量:75382
由这两个数字得知正负样本不均衡,
看了几个大佬的数据集划分总觉得有些可能是后期进行过修改的,于是决定先用最简单的数据集划分方式,如下图:
滑窗法以增加样本(修改:所有特征区间改为feature窗口,预测区间改为label窗口。feature区间-2取02/01-05/31,label窗口-2取06/01-06/30)
负样本数量:977900
正样本数量:75382
由这两个数字得知正负样本不均衡,
本文标题:数据集划分
本文链接:https://www.haomeiwen.com/subject/smvbyxtx.html
网友评论