#学习笔记#
什么是信息流产品?信息流产品的价值在哪
就是面向合适的用户推荐合适的内容。
我们从内容交互算法三个层面来解释
![](https://img.haomeiwen.com/i22797625/757ff1d36b5fb390.png)
基于以上,我们也能得出信息流的价值所在
用户价值:近年来,O2O等其他行业,用户增长已达到瓶颈,而短视频和信息流,仍有着相对迅猛的用户增长势头;同时短视频和信息流这一类用户黏性高,用户平均使用时长相对于其他类型产品会更高
商业价值:信息流广告是很高效的变现模式,它的形式和信息流内容相似,且符合用户画像,用户更容易接受,它非常类似于搜索广告,有天然的用户偏向的优势,可以得到用户很好的正向反馈
什么是推荐系统
可从以下两个问题加以解读:
#它能做什么
万事万物是相互联系的,这是世界发展的必然趋势,但也正是由于我们身处于一个信息大爆炸的时代,我们与事物更快建立连接的同时,也面对的着更多的“噪音”,让人容易迷失在信息的海洋之中,这时候,推荐系统就可以将最终会在用户(user)和物品(item)之间产生的连接提前找出来。
#它需要做什么
建立连接的前提是需要清楚user需要的item是怎样的,怎样的item会更吸引哪一类型的user,而想要知道他们互相需要什么,就需要从已有的连接中进行分析,换言之,就是需要从已有连接中预测未来的连接。
如何推荐内容
一般采用 人工运营 + 推荐算法 结合的形式,两者都有对方不可替代的优势,互补来完善整个信息流体系
#人工运营的优势:
经验丰富的从业者,对行业热点有着极高的敏感度,可以快速找到和分析出哪些内容是近期关注热点和什么是更有价值的新闻,同时新闻是具有时效性的,专业从业者对于突发事件的响应远优于模型算法;且人对信息的判断,除了语义语法,更多的还有情感,而对情感的甄别通过算法练习达到人工的程度几乎是不可能的。
#推荐算法的优势:
机器可以预估CTR、做个性化匹配、可以进行学习和聚合分析。
每个行业每个细分领域的信息有成千上万,其中热点信息只是冰山一角,而那些多如牛毛的非热点信息如果统统使用人工处理,将耗费大量的人力且由于人的精力和知识都是有限的,不能保证对所有信息都进行精准匹配,更不能保证这些信息符合单个使用者的兴趣,因此我们需要推荐算法的帮助。
如何判断一个产品是否需要推荐系统
首先是看产品的目的,如果产品的目的是为了建立更多的人与物或人与人的连接,那最终必然是需要推荐系统的,如果产品只是工具类产品,也因为体量原因暂时不打算增加社交属性,则这个产品就暂时不需要推荐系统。
另外是看这个产品现有的连接,如果平台item很少,那就还不适合去做推荐系统,因为此时人工就可以解决问题了;或如果物品和用户基数不少,但连接很少,这说明平台可能在定位、用户留存等方面有大问题,应该先解决了这些问题再来谈是否要去做推荐系统。
以及,还有很多的战略问题需要考虑,如,平台是否有足够的资本去搭建团队、产品的现有属性是否能讲好推荐系统的故事以方便融资 等等。
理论上的简化框架
![](https://img.haomeiwen.com/i22797625/218ce8177a997033.png)
#用户行为上报系统:记录用户行为,并上报至存储系统
#用户行为日志存储系统:存储用户行为数据
#推荐系统:分析用户行为,生成推荐数据列表
推荐算法案例
![](https://img.haomeiwen.com/i22797625/120dbdc14933a403.png)
如何评估推荐质量
#算法模型的分流
一个项目可能使用多个算法模型,但多个算法模型由于其稳定性不同,其所能获得的流量也是不同的,平台会选择将绝大部分的流量分给相对稳定的模型,再将少部分流量分发给实验模型,不断训练实验模型直至模型稳定
![](https://img.haomeiwen.com/i22797625/c81f1d3359bf83f7.png)
算法模型的评测指标
评测一个实验算法模型是否符合预期,需要关注哪些指标
#准确率:实验过程中,推荐列表里有多少比例的文章是用户阅读过的
#召回率:推荐列表中,用户读过的文章占用户阅读文章总数的比例
#覆盖率:推荐列表中的文章,站文章库总数的比例
核心业务指标
实际业务中,信息流产品需要关注哪些指标
#UV转化率=阅读UV÷曝光UV 反映有多少比例的曝光用户转化为阅读用户
#PV转化率=阅读PV÷曝光PV 反映文章的平均转化情况
#人均篇数=阅读PV÷阅读UV 反映内容消费的深度
#人均阅读时长=阅读总时长÷阅读UV 反映用户平均花费在阅读上的时间
只追求UV和PV转化,会导致标题党文章大量增加,会导致文章低俗话,深度用户流失,产品调性下降,为防止这一情况,解决办法是 —— 在rank模块的模型训练阶段,文章的排序由预估CTR和time共同决定。
网友评论