以这个kernel为例,
这是目前公开notebook中分数最高的了,
模型:light gbm
验证策略:从id中随机选择一部分ID作为验证集
特征:同一id过去7天的销量,过去28天的销量,同一id,过去7天平均值,过去28天平均值,过去7到7+28天平均值,过去28到28+7天的平均值,日期特征:是否工作日,一年中第几周,月度,季度,年度,日
其他:loss 采用poisson, 由于要预测28天,训练时去掉以上特征中出现NA的,预测时新预测的一天作为已知值来计算lag feature
效果:leaderboard:0.52056
网友评论