https://36kr.com/p/5150648(科普)
ECPM(earning cost per mille)=1000CTR点击出价**
CTR(Click-Through-Rate):点击率
在实际的广告系统中,有无数的因素决定了广告的点击率,我们把这些因素主要分成3类——**
第一是广告主侧,比如广告创意、广告的表现形式、广告主行业等,一个劳斯莱斯的广告和一个可口可乐的广告点击率肯定有天壤之别。
第二是用户侧,如人群属性,以上的案例是年龄和性别,事实上,决定创意的因素人群属性极其多——年龄、性别、地域、手机型号、WiFi环境、兴趣........
第三是广告平台侧,比如不同的广告位、投放时间、流量分配机制、频次控制策略等。
从结果指标来看,ECPM是衡量CTR预估最为重要的指标,当然,在实际的实践过程中,CTR预测正确通常ECPM、CTR、收入这些指标通常都会涨。
把预估CTR和真实CTR直接进行对比,由于预估CTR针对每一次广告展示都会预估,比如这一次预估CTR为2%,但单次广告真实CTR只有两个结果,点或不点,即100%、0%,所以看单次结果是没有意义的,我们应该从一个群体来看——
将每一次广告曝光按照预测的CTR从小到大排序,然后按某个单位(比如每10000个曝光)分别统计平均预估CTR和实际CTR,就能知道预测CTR的准确程度了。
https://www.hrwhisper.me/machine-learning-fm-ffm-deepfm-deepffm/
FM
经过One-hot编码后,特征空间是十分稀疏的。特别的,某类别特征有m种不同的取值,则one-hot编码后就会被变为m维!当类别特征越多、类别特征的取值越多,其特征空间就更加稀疏。
此外,往往我们会将特征进行两两的组合,这是因为:
通过观察大量的样本数据可以发现,某些特征经过关联之后,与label之间的相关性就会提高。例如,“USA”与“Thanksgiving”、“China”与“Chinese New Year”这样的关联特征,对用户的点击有着正向的影响。换句话说,来自“China”的用户很可能会在“Chinese New Year”有大量的浏览、购买行为,而在“Thanksgiving”却不会有特别的消费行为。这种关联特征与label的正向相关性在实际问题中是普遍存在的,如“化妆品”类商品与“女”性,“球类运动配件”的商品与“男”性,“电影票”的商品与“电影”品类偏好等。
-->
FFM
由于FM每个特征只用一个隐向量来学习和其他特征的潜在影响,而它对其他特征的影响可能是不同的,因此把相同性质的特征放入一个类中
DEEPFFM
网友评论