美文网首页
推荐系统26:数据驱动和实验平台

推荐系统26:数据驱动和实验平台

作者: 勇于自信 | 来源:发表于2021-06-16 23:31 被阅读0次

    数据驱动这个口号喊了很多年了,这个口号也几乎成为了行业共识,但是数据驱动又像鬼一样,人人都在说,但几乎没人见过它长什么样子。

    数据驱动和实验平台

    要做到数据驱动,就要做到两点:第一点是数据,第二点是驱动。这听上去似乎像是废话,实际上不是。

    这第一点的意思是,要采集数据,全方位,数据像是石油一样,没有它就谈不上驱动;第二点的意思是要让大家看数据,光采集了没有用,还需要让所有人盯着数据看。

    而要做到驱动,需要一个 AB 实验平台。数据驱动的重点是做对比实验,通过对比,让模型、策略、设计等不同创意和智慧结晶新陈代谢,不断迭代更新。

    对比实验也常常被大家叫做 ABTest,这个意思就是一个 A 实验,一个 B 实验,这样说可能有些模糊,所以我需要先和你说说什么叫做对比实验,然后再说说一个对比实验平台应该长什么样子。

    你都可以把任何一家个性化推荐产品想象成一个函数,这个函数有很多参数影响它工作,函数的输出就是推荐物品列表。这些函数参数可以有各种组合,通过其中一种参数组合去面对一小股用户的考验,这就是一个实验。

    要做实验,要做很多实验,要很快做很多实验,要很多人同时很快做很多实验,就需要实验平台。

    要讨论实验平台,先要认识实验本身。互联网实验,需要三个要素。

    1. 流量:流量就是用户的访问,也是实验的样本来源。
    2. 参数:参数就是各种组合,也是用户访问后,从触发互联网产品这个大函数,到最后返回结果给用户,中间所走的路径。
    3. 结果:实验的全过程都有日志记录,通过这些日志才能分析出实验结果,是否成功,是否显著。

    把互联网产品想象一个有向无环图,每个节点是一个参数,不同的分支是参数的不同取值,直到走到终点,这一条路径上所有经过的参数取值,构成了服务的调用路径。

    具体在推荐系统中,可能这些参数就是不同的模型与策略名称。每当一个用户经过这一系列的调用路径后,就为每一个分支产生了一条实验样本。

    于是问题来了,每一个用户到来时,如何为他们决定要走哪条路径呢?这就要先经过实验对照来看。

    实验要观察的结果就是一个随机变量,这个变量有一个期望值,要积累很多样本才能说观察到的实验结果比较接近期望值了,或者要观察一定时期才能说对照实验之间有区别或者没区别。

    因为只有明显有区别并且区别项好,才能被进一步推上全线。

    相关文章

      网友评论

          本文标题:推荐系统26:数据驱动和实验平台

          本文链接:https://www.haomeiwen.com/subject/zglqyltx.html