作者:蒋树林
编辑:PRS 布道者
打破对推荐系统的认知偏见
今日头条用个性化内容分发系统获得了极大成功,但是也引起了很多质疑,被质疑得最多的有两点:一是内容低俗,二是带来的信息茧房。
偏见一:内容低俗
不得不说,头条上面确实很多低俗内容,而且你一旦点击一些低俗内容,后面的推荐结果就会出现更多的低俗内容。但是,推荐算法不能背这个锅,这都是公司追求更长的用户使用时长,更高的点击率的结果。 当然,那些点击低俗内容的人自己也得反思一下,你要是不点那些内容,头条也不会持续给你推荐不是。
相反,其实我们可以通过算法来减少低俗内容。如果平台不愿意让低俗内容泛滥,成为今日头条那样的公司,除了其他产品形态上的差别,在算法上也可以识别低俗内容,减少其分发量的。
偏见二:信息茧房
2006年,凯斯·桑斯坦在其著作《信息乌托邦——众人如何生产知识》书中,提出了信息茧房概念。书中指出,公众自身获取的信息是不完整的,而且一般只注意自己选择的和是自己愉悦的领域,久而久之,就把自己关进了一个“信息的茧房”。
所以,简单来说,获取不全面信息,就是将自己关进了信息茧房。而一些人认为推荐系统使得信息茧房问题更加严重。
信息茧房真的是推荐系统引起的吗?推荐系统真的会加重信息茧房?我个人是严重怀疑的,认知心理学上有一个著名的词叫做——认知吝啬鬼,揭示了人类大脑的一个重要秘密,那就是几乎每个人都是能不用脑就不用脑,而要摆脱信息茧房,则需要大量的脑力,这是及其耗费脑资源的事情,大脑会尽量避免去做。
比如,美国的Fox电视台明显偏向右派,而在2018年第一季度有线电视收视率中,Fox news排名第一。有线限电视没有个性化推荐系统,而且明显偏向右派,但是却如此受人们喜爱,看电视的人自己选择了自己政治立场,而那些与之向左的内容,都被其忽略掉了。
所以信息茧房跟人的底层认知结构有关,推荐系统只是帮你快速找到自己想看的内容而已,并不能够把你从右派变成左派。
退一万步说,其实推荐系统还有一个避免用户陷入信息茧房的方法呢。那就是推荐系统的E&E机制——Exploitation(利用已有兴趣推荐)和Exploration(探索新的兴趣)。Exploration的工作就是在避免用户陷入信息茧房,这也是每个推荐系统必备的模块。
为什么PRESS.one需要一个推荐系统?
2004年10月,《连线》杂志主编克里斯·安德森提出了长尾(Long Tail)理论,文章中指出,商业和文化的未来不在传统需求的头部,而在于需求曲线中那条长长的尾巴。
传统书店Barnes&Noble的平均上架书目为13万种,而Amazon上一大半的图书销量来自于其排名13万之后的图书。这意味着那些不在传统书店销售的冷门书籍的销量超过了热门甚至畅销的书籍。这背后除了亚马逊的商业模式之外,推荐系统也起到了极大的作用,据亚马逊官方数据批量,其30%的销售额来自于推荐系统,足见推荐系统的重要程度。
内容分发也呈现出长尾效应,大的内容生产平台,每天产生百万、千万条内容,一个用户打开APP,在这上亿条内容里面,究竟哪些该推送给用户呢?热门?流行?
热门文章其实就跟传统书店一样,能够呈现的内容非常有限(目前的币乎就是这样),会出现两个问题:
一是长尾的冷门作者的内容很难得到分发,可能导致其离开该平台;
二是用户无法看到自己真正感兴趣的内容,毕竟每个人的喜好都千差万别,根据长尾理论,热门文章(即头部文章)只有一小部分人才会喜欢,这会使得大部分读者也会离开该平台,最终该平台也只能够是一个小众平台。
所以,为了更好的用户体验,不仅能够使长尾的创作者的内容也能够得到分发,也使用户的长尾兴趣也能够被满足,那么个性化的推荐系统是必不可少的。
个性化推荐系统能够提供更高的内容分发效率,在用户一进入到应用首页,一眼就能够看到其最想看到的文章,而避免用户苦苦搜寻,这样才是更好的用户体验。
image.png打破偏见,重视个性化推荐
白皮书中对于推荐的描述就这么一句话(“推荐”在全文中只出现了两次):
以集中化的方式去分发范类型内容存在很多问题。更合理的方式是根据用户属性、内容类型、应用场景去有针对性的做推荐、导流及分发。
当然,白皮书中也没有提到集中化的方式分发有哪些问题,具体怎么根据用户属性去做内容分发。不过作为一名推荐系统的算法工程师来看,根据用户属性、内容类型等来做推荐这都是老一代(十年前)推荐系统做的事情了,目前新的推荐系统都大量采用机器学习算法来做的,当然包括流行的深度学习、甚至强化学习等技术了。
内容分发其实是天然的大数据和人工智能应用场景,这方面PRESS.one却只字未提,团队将几乎所有的精力都放在了经济系统的设计上,而忽略了内容分发平台上最重要的任务——那就是内容分发效率。
一个读者无法快速从中海量的内容中发现自己感兴趣的内容,怎么能够留住读者?一个不知名的小作者写出来的文章就无人问津,怎么鼓励其持续创作?个性化推荐系统就是解决满足用户的长尾兴趣,帮助普通创作者的长尾内容分发的最好方式,而长尾兴趣和长尾内容的市场远远大于大众的所谓流行热门市场。回头再看看传统的新闻门户和今日头条的用户数量、用户使用时长、市值等对比就知道了。
PRESS.one在个性化推荐上几乎没有任何作为,可能跟其管理者的个人偏见有关,设计了如此优秀的经济系统,创立PRESS.one的野心也不小,希望能够补上大数据和人工智能,用基于机器学习算法的推荐来实现更高效的内容分发,成为一个区块链世界,用户最多的应用。
点击查阅蒋树林后续文章:
点击查阅PRESSone产品技术群关于该主题的讨论:
点击查阅PRESSone白皮书:https://static.press.one/files/PRS_whitepaper_1_0_1_cn.pdf
网友评论
一个人的思考带动一群人的思考,一个人的见解激发更多新的见解。这也是一种价值的放大与延伸。
类比内容版权:
一个优秀的内容产出之际,就可以设想它的各种价值放大策略,利用区块链技术公开、公正、透明的优势,绑定可灵活拓展可自定义且自动执行的智能合约,激励所有潜在的顾客共同参与创造价值,共享收益。