FiBiNET模型

作者: 缄默笔记 | 来源:发表于2019-10-06 00:15 被阅读0次

FiBiNET模型
有哪些主要的软件生存期模型
【原创】产品生命周期模型
三阶段day18-flask
敏捷开发（适合产品经理看）
Swift 字典转模型
一些常见模型类型与分类的初步讨论
几种软件模型的比较
框架_Django_2
23.1 信息系统综合测试与管理

论文：FiBiNET: Combining Feature Importance and Bilinear feature Interaction for Click-Through Rate Prediction

https://arxiv.org/abs/1905.09433

简介

（1）FiBiNET通过SENET（Squeeze-and-Excitation network）机制动态学习特征重要性；

（2）当前的许多通过特征组合进行 CTR 预估的工作主要使用特征向量的内积或哈达玛积来计算交叉特征，这两种方法比较简单，在稀疏数据集上，很难有效地对特征交叉进行建模，文章提出一种双线性函数学习特征交叉。

1 网络结构

结构主要包含：输入层、Embedings层、SENET层、Bilinear-Interaction层、Combination层和DNN层。

2 SENET Layer

2.1 SENet

SeNet来源于CV，结构如下，包括三个过程：

（1）Squeeze：顺着空间维度来进行特征压缩，将每个二维的特征通道变成一个实数，这个实数某种程度上具有全局的感受野，并且输出的维度和输入的特征通道数相匹配。它表征着在特征通道上响应的全局分布，而且使得靠近输入的层也可以获得全局的感受野，这一点在很多任务中都是非常有用的。

（2）Excitation：它是一个类似于循环神经网络中门的机制。通过参数 w 来为每个特征通道生成权重，其中参数 w 被学习用来显式地建模特征通道间的相关性。

（3）Scale：将 Excitation 的输出的权重看做是进过特征选择后的每个特征通道的重要性，然后通过乘法逐通道加权到先前的特征上，完成在通道维度上的对原始特征的重标定。

使用 global average pooling 作为 Squeeze 操作。紧接着两个 Fully Connected 层组成一个 Bottleneck 结构去建模通道间的相关性，并输出和输入特征同样数目的权重。我们首先将特征维度降低到输入的 1/16，然后经过 ReLu 激活后再通过一个 Fully Connected 层升回到原来的维度。这样做比直接用一个 Fully Connected 层的好处在于：

1）具有更多的非线性，可以更好地拟合通道间复杂的相关性；

2）极大地减少了参数量和计算量。然后通过一个 Sigmoid 的门获得 0~1 之间归一化的权重，最后通过一个 Scale 的操作来将归一化后的权重加权到每个通道的特征上。