DeepFM

作者: 山的那边是什么_ | 来源:发表于2018-08-11 17:05 被阅读242次

    1.背景

    这篇论文来自哈工大&华为诺亚方舟实验室,主要关注如何学习user behavior背后的组合特征(feature interactions),从而最大化推荐系统的CTR。但目前的方法容易得到low-或者high-order interactions。因此这篇论文提出构建一个端到端的可以同时突出低阶和高阶feature interactions的学习模型DeepFM。DeepFM是一个新的神经网络框架,结合了FM在推荐中的优势和深度学习在特征学习中的优势。

    2.原理

    2.1 网络结构图


    DeepFM包含两部分:FM部分和deep部分,这两部分共享同样的输入。
    模型方程:


    2.2 FM 部分

    2.2.1 网络结构


    FM 输入是field特征,每个field可能是one-hot 特征 或者是连续特征。FM 是在LR的基础上,增加了交叉特征,同时对每个交叉特征定义了一个隐藏向量,用来刻画交叉特征的重要程度。
    模型方程



    V_i 是 field_i 的 k 维隐藏向量。

    2.3 deep部分

    2.2.1网络结构


    可以看着是这是一个全链接的前馈神经网络,用来学习高维的交叉特征。

    2.2.2 embedding层设计

    网络结构



    embedding层的设计:
    (1)对于不同长度的输入field向量,得到的embedding长度都是k;
    (2)FM中的隐含向量V现在作为神经网络的权重,被学习来压缩输入field向量到embedding向量。
    embedding层的输出是m个field对应的e向量,传入DNN,最后得到一个稠密实值向量,经过一个sigmoid函数得到预测的CTR。

    2.3优点

    1. FM 学习了低维的交叉特征,DNN 学习了 高维的交叉特征。
    2. 相对Wide & Deep算法不需手工构建输入特征。


    2.4 实验结果

    3.参考文献

    1. https://zhuanlan.zhihu.com/p/27999355
    2. 论文地址:https://arxiv.org/pdf/1703.04247.pdf

    相关文章

      网友评论

          本文标题:DeepFM

          本文链接:https://www.haomeiwen.com/subject/lmazmftx.html