美文网首页推荐系统修行之路
CAN:点击率预估中特征交互作用01

CAN:点击率预估中特征交互作用01

作者: Nefelibatas | 来源:发表于2022-02-28 15:01 被阅读0次

    推荐系统算法之读论文系列开启!

    点击率预估中特征交互作用CAN

    前期知识储备

    • 笛卡尔积

    • 神经网络

    • 特征交叉

    • tensorflow

    学习目标

    • 构建训练数据(样本侧)

    • 特征工程(特征侧)

    • 模型结构(模型侧)

    • 评估

    作者思路:通过特征工程存在的问题,运用模型结构去解决特征工程的问题

    模型结构

    • DIEN

    • CAN(包含了DIEN)

    • 针对序列特征

    数据集

    • Amazon行为数据集

    • Avazu行为数据集(无序列)展示泛化性

    特征交互(论文的灵魂部分)

    image-20220227223416704.png

    作者提出的问题:当前研究主要针对隐性表征少有针对显性表征的研究,如何进行显性表征以及如何进行显性特征挖掘。

    解决方案:作者提出Co-Action单元,可嵌入任何网络中、捕获特征交互的多阶信息、多层迭代。

    研究背景

    学术理论

    • 当前点击率预估模型没有完全挖掘特征交互的潜力

    • 特征的表征学习与特征的交互存在冲突

    • 笛卡尔积的方法比当前的点击率预估模型效果都好

    工业落地考虑

    • 算法模型的效率和效果的平衡

    • 阿里巴巴线上业务量级和耗时的考虑


      image-20220227224005490.png
    image-20220227224603761.png

    F(F(A) + F(B)) -> target

    原始信息到向量有信息损失,如A泳衣与B护目镜有所关联,在No Co-Action中只有转化为向量才开始关联,丢失了原始信息A与B之间的关系。

    特征交互的潜力挖掘:

    在Co-Action中A与B同时出现组合作为一个特征放入到Target中,表示A、B相互关系作用,当A与B组合为0则等同于No Co-Action中的F(F(A) + F(B)) -> target。

    F(F(A) + F(B) + F(A,B)) -> target

    如何捕捉A与B之间的关系?

    笛卡儿积,即特征组合。

    作者提出的问题:

    Q: 笛卡尔积的方法优于大部分方法,但是带来了巨量的参数?

    Q: 如何平衡特征表达和特征交叉的学习?

    之后围绕这两个问题论文中提出各种解决方案。

    研究成果

    这篇论文的主要贡献

    • 强调了特征交叉建模的重要性

    • 提出一个轻量级的模型(CAN)

    • 在公开数据集和工业环境进行了验证有效性

    • 提出了一种工业部署技术

    阿里巴巴线上部署后,带来平均12% CTR(点击率) 提升和8% RPM(千次展示收入) 线上提升。

    将DIEN作为基线进行比较。

    即可用于序列特征也可以用于常规特征。

    研究意义

    Co-Action Network 的意义

    • 想为特征交互走一条新的路

    • 工业落地的产物

    CAN是我们希望推进找到模型化的方案替代笛卡尔积建模co-action,背后希望的是找到一

    条新的路,让交互信息建模还有进一步的迭代空间

    论文结构

    Abstract

    介绍背景,提出问题及给出解决方案Co-Action Network

    Introduction

    • 特征交互的意义及有效性

    • 介绍本论文主要贡献

    RELATED WORK

    • 基于聚合的方法

    • 基于图的方法

    • 基于组合的方法

    Details of CTR

    • 特征交互在ctr预估中的作用

    Details of Co-Action

    • Co-Action Unit的结构

    • 参数细节调整

    • 多层网络增强

    EXPERIMENTS

    • 学术公开数据集:Amazon,Avazu

    • 与常规方法的比较

    Results

    • 离线指标AUC

    • 消融实验对比

    Results online

    • 线上实验结果分析

    CONCLUSION

    • 总结模型的有效性

    相关文章

      网友评论

        本文标题:CAN:点击率预估中特征交互作用01

        本文链接:https://www.haomeiwen.com/subject/vmulrrtx.html