美文网首页
Bandit 推荐系统间探索与利益的均衡

Bandit 推荐系统间探索与利益的均衡

作者: 机器不能学习 | 来源:发表于2019-03-29 11:56 被阅读0次

Bandit算法

该算法是为了解决MAB问题(多臂赌博机问题)

问题原形是,面对多个一样的老虎机,每个老虎机吐钱几率不一样。要怎么样选择才能达到利益最大化。

这里会有一个EE问题,即Exploitation-Exploration(E&E)我们如何在利益和探索之间均衡。我们已经有几台的吐钱率高,我们是选择只在这几台操作,还是要继续探索其他可能吐钱率更好的机器。

对于Bantid算法我们的核心思想是,使遗憾度最低。

Bandit 推荐系统间探索与利益的均衡

前者是 最好机器上的获利,后者是所选机器的获利。两者之差就是遗憾度。

我们又可以按照是否利用上下文(商品和用户特征值),分为两类。当然利用上下文的要好很多。

LinUCB

该算法是从不使用上下文的UCB改进而来。

UCB算法,会计算一个得分

Bandit 推荐系统间探索与利益的均衡

+号前面是收益,后面是最大置信上限

ni是一共的尝试次数,n是该商品的尝试次数。

该式子很好的均衡了探索和已知利益。

最后对每个商品的得分排序,选出最该推荐的商品。

由于该算法没有任何的上下文信息,所以雅虎对其进行了修改。

他们假设,我们的上下文与收益是成线性关系

Bandit 推荐系统间探索与利益的均衡

现在我们的任务是学习到这个参数theta,这样对于新来的数据,我们就可以根据数据上下文计算其收益。

Bandit 推荐系统间探索与利益的均衡

我们采用岭回归(L2正则),由于我们的方程只有一个未知量。我们用标准化解法

Bandit 推荐系统间探索与利益的均衡

(一般只用于数据量比较少的时候,不然计算起来很缓慢)

Bandit 推荐系统间探索与利益的均衡

得到theta,这时我们可以把theta表示为

theta = A转置*b    b = DTc

于是我们实时计算步骤在此

Bandit 推荐系统间探索与利益的均衡

这就是我们的LinUCB了。

该算法的速度很快是线性的。

不是上面说theta标准化运算数据量大会很慢吗?其实因为我们是实时更新,所以A和b都是每次更新一行,最后运算的不过是b*A

置信上限是什么呢?

程序中的

Bandit 推荐系统间探索与利益的均衡

是置信上限。它是由L2参数theta服从高斯分布得来的。具体过程我也没研究。

相关文章

  • Bandit 推荐系统间探索与利益的均衡

    Bandit算法 该算法是为了解决MAB问题(多臂赌博机问题) 问题原形是,面对多个一样的老虎机,每个老虎机吐钱几...

  • Bandit算法与推荐系统

    推荐系统里面有两个经典问题:EE和冷启动。前者涉及到平衡准确和多样,后者涉及到产品算法运营等一系列。Bandit算...

  • 传统推荐算法

    传统推荐算法 Bandit算法与系统推荐 在推荐系统里比较经典的问题,就是EE和用户冷启动问题 什么是EE,两个单...

  • bandit 算法在推荐系统中的应用

    个性化推荐 随着APP的流行,企业能收集更多更全的用户数据,如何利用这些数据提高收入是各企业都会面临的问题。最常见...

  • 推荐系统遇上深度学习(十二)--推荐系统中的EE问题及基本Ban

    1、推荐系统中的EE问题 Exploration and Exploitation(EE问题,探索与开发)是计算广...

  • 转载:E&E

    Exploration and Exploitation(探索与开发)是计算广告和推荐系统里常见的一个问题,在数学...

  • 推荐系统16:简单却有效的Bandit算法

    我们在之前的文章中表达过,推荐系统的使命就是在建立用户和物品之间的连接。建立连接可以理解成:为用户匹配到最佳的物品...

  • 3、6、9系统

    +3、+6、+9系统是三位一体的存在,冲动,质疑,正反思考,保持最大的中立与均衡各方利益,最终达至双赢。 而-3、...

  • 2022-10-20

    在工作中,他是一道利益生态系统,部门之间,员工之间,存在利益,一旦利益不均衡,工作积极性必然被打破。 对于自己的部...

  • 【利益】如何利益分配均衡?

    利益永远是分配不均衡的,只要有人心在,有贪欲在,就无法利益均衡。 古时,商人地位低,其中一点就是商人重利,无利不起...

网友评论

      本文标题:Bandit 推荐系统间探索与利益的均衡

      本文链接:https://www.haomeiwen.com/subject/glclbqtx.html