美文网首页
特征构造中的历史平移问题

特征构造中的历史平移问题

作者: LZhan | 来源:发表于2019-07-19 17:00 被阅读0次

在电商推荐的场景中,常常会出现:
我们在准备样本数据的时候,会采用某物品的最近n天的曝光和点击来作为样本数据,其中单品曝光但是用户未点击,则为负样本;单品曝光且用户进行点击行为,则为正样本。
准备好正负样本数据后,在进行模型训练的时候,我们会选择最近n天的用户行为数据来构造一些特征,比如说某用户最近n天点击某品牌单品的次数,点击某品类单品的次数等等;
这种方式看起来是没有问题的,实际上里面却存在着时间平移的问题。

比如说,某条样本数据,该样本数据来自于最近n天中的第1天,之后我们再去关联相关特征,但是实际上并不能保证关联的这些特征是通过最近n天的第1天的用户行为数据获得的,很大的可能性是最近n天的后几天的数据产生的特征;
也就导致了样本与特征的关联,是错误的。

正确的做法:第d天的样本,应该先找出第d-n天到第d天的数据,构造出相关特征,进行关联,得到第d天的完整的带有各种特征的样本数据 d0;
第d-1天的样本,应该找出第d-1-n到第d-1天的数据,构造出相关特征,进行关联,得到第d-1天的完整的带有各种特征的样本数据 d1;
同理....
最后将d0,d1,d2 等样本合并起来,才形成最终的样本数据。

相关文章

  • 特征构造中的历史平移问题

    在电商推荐的场景中,常常会出现:我们在准备样本数据的时候,会采用某物品的最近n天的曝光和点击来作为样本数据,其中单...

  • 平移构造平行四边形

    平移构造平行四边形

  • 20年04月论文读书笔记

    卷积神经网络(CNN):可以捕获图像稳定的local 局部特征和模式 其利用权值共享的理念为解决物体的平移问题而设...

  • 构造函数与new

    构造函数 构造函数就是一个普通的函数,但是具有着自己的特征和用法。 上面代码中,People就是一个构造函数,为了...

  • 从历史中构造未来

    “要理解未来,就要回顾历史,而回顾历史的年限,至少是预见年限的两倍。” 没有基石的未来是不牢固的,也没有凭空想象出...

  • 基于C++的平面形状编辑器的设计与实现

    按照下面类图给出的层次关系来定义类 所有形状支持无参数构造,有参数构造,拷贝构造,析构 所有形状支持平移操作,需要...

  • [Paper Share - 4]R-FCN :Object D

    导读本文是何凯明的作品。文章为了解决图像分类中平移不变性和目标检测中平移变换性的困境,构造position-sen...

  • Task 3:特征工程

    特征工程 导入数据 特征构造 特征筛选 过滤式 包裹式 嵌入式

  • OpenGL自行车(一):车子框架

    目的:构造轮子自动旋转的自行车 主要使用了: 矩阵构造(平移、旋转) 模型视图矩阵 三角形批次类(创建轮子) 投影...

  • 《WebGL编程指南》学习笔记17——复合变换-先平移再旋转

    本系列仅作为本人学习《WebGL编程指南》这本书的笔记所用 构造模型矩阵: 先平移后旋转的顺序与构造模型矩阵的顺序...

网友评论

      本文标题:特征构造中的历史平移问题

      本文链接:https://www.haomeiwen.com/subject/jlrklctx.html