视奸渣浪的feed流算法

作者: 纯银V | 来源:发表于2016-11-17 09:08 被阅读16899次

鉴于渣浪的微博feed流算法被骂得特别厉害，把我知道的算法公布一下。我可没什么内部消息，只不过长期视奸微博CEO的评论，再加上脑补，盲人摸象，说错了你们别怪我。

我视奸了解到的微博调整feed流算法，有三个阶段。

1、
第一个阶段是打压蓝V和营销号，从去年底开始。

蓝V就是企业认证号，对“营销号”的定义则是对百万级粉丝，高传播微博进行人工排查，把肉眼可辨识的营销号标记出来。

算法大致是这样的，这批PO主发布的内容，首先只分发给5%的粉丝，进行灰度测试。如果互动率高，进一步分发给15%的粉丝，最多也就15%。具体的数字不断调整，并不严格遵照5-15的标准。

这么做的理由是，微博认为蓝V和营销号天然有动力“大量发布内容”，尤其是非原创微博，或低价值的营销微博。这部分内容比例增大，就会挤压原创内容的曝光率，而微博的策略是鼓励原创，扶持自媒体。毕竟开心网和人人网饮鸩止渴，放纵转帖组件的恶果历历在目。

你问我怎么看呢，我其实是支持这个算法的。的确粗暴，的确不近情理，的确搞一刀切，但广州市搞一刀切禁摩之后，治安的确大有好转，我是亲历者。在当时那个feed流环境下，可能没有更好的办法，只能牺牲蓝V和营销号的利益，确保更多人的利益。反正当前阶段蓝V和营销号对微博生态的价值不大，该种田的时候就得拔草。

很多人对此评论说：“觉得烦我自己会取关，不用你渣浪多事”。我作为产品经理代答“呵呵”，翻个白眼给你看。

也有人评论说，是不是非得用这么粗暴的手段？能不能用更好的方法筛选出内容优质的蓝V和营销号，而不是一刀切？但我觉得，以优质内容的比例之少，大可不必这么折腾。毕竟企业经营不是白左小清新，讲的不是大爱无疆公平正义，而是效率与投入产出比。

不过，这套针对蓝V和营销号的算法，疑似被新的“未读池”全局算法迭代了，稍后再讲。

2、
又过了几个月，大概是今年春节后，算法的屠刀砍到了普通用户头上。正应了那句“起初他们…因为我不是…我不说话；接着他们…我不说话；最后…再也没有人为我说话了。”

好吧我是在搞笑(可能你并没有笑)，新的算法我也是支持的。

新算法大致是这样的，即便你是普通用户，长图微博被降权，转发被降权，内容触发了敏感字被降权。敏感字包括政治、情色、竞品等等。

降权的意思是，你发出的微博只会被一定比例的粉丝看到，或者在未读池里排到后面再出来。

这段时间微博面临的问题有可能是，怎样增加高价值内容的曝光率？于是对低价值内容降权。什么是低价值内容呢？比如说长图的浏览体验不如微博自家的头条文章，且内容无法导入搜索引擎，所以要降权。转发的内容价值通常不如原创，也要降权。敏感字就更不用解释了。判断高价值低价值的规则很多，我只猜到这几个。

然后你多半要问两个问题。

问：为什么非得降权不可呢？为什么不能对优质内容加权呢？
答：傻孩子，你想想，每天刷微博的时间就这么多，一些内容加权被优先看到，占据了注意力，另一些内容相当于被降权。“降权”的措辞让你心里不舒服，但结果其实是一样的。

问：凭什么要新浪微博来决定我看什么不看什么，凭什么？
答：综合微博feed流的速度，用户打开微博的频次，很大一部分内容是被错过的，这是不可避免的。微博官方有动力来优化“可见内容”的构成，这对于用户本人来说反倒是不可控的，随机性的。同样的事情Facebook做了很多年，也被用户骂了很多年，痴心不改。不改不改就是不改，你有志气就不要用。

从产品专业的角度来讲，当feed流速到了某一个地步，用算法来优化内容构成就是一件不可避免的事情，挨骂也是一件不可避免的事情。因为这个算法起作用，内容价值提升的时候，你意识不到，觉得是自己眼光好，订阅的PO主质量高。但是当你发现订阅内容丢失的时候，人之常情，必定破口大骂。

渣浪唾面自干。

骂归骂，如果feed流的内容价值真的提升上去了，你其实是离不开的。边骂边用，边用边骂。环球同此凉热，彼岸Facebook搞这套都多少年了，渣浪只是个学生。什么？你说Twitter？Twitter用没用feed流调节算法我不知道，但它的市值持续走低，用户增长乏力可是不争的事实。渣浪微博的市值已超过Twitter，这是10月的最新消息。

3、
好了，终于到了本文的重点。以上两套算法对普通用户影响不太大，那么渣浪怎么到了千夫所指，人人喊打的地步呢？是因为4月左右推出的全局算法，关键字是“未读池”。

什么叫未读池呢？就是指你订阅PO主所发的微博，如果你没刷到过，还是未读状态，就会进入未读池。

当你刷新timeline时，会按照一定的规则，一次只取出15-30条内容，而不是全部未读内容。算法优先取权重高的，刚刚发布的内容，取完以后你再刷新，从未读池里边接着提取。说白了就是“智能分批提取数据”，而不是传统的“一次性提取全部未读数据”。

我给你们解释背后的原因。

刚才提到过“feed流很大一部分内容是被错过的，这是不可避免的”。比如说你半天刷一次微博，这段时间订阅的PO主产生了80条信息，但平均下来，一次浏览的微博数量是15-30条，剩下的内容看不完，在过去，它就被浪费掉了。

被浪费掉的内容里，很可能有高价值的，特别值得看的，也被浪费掉了。

然后，你这段时间特别空闲，过了15分钟又去刷微博。这么短的时间间隔，新产生的信息只有5条。你觉得没意思，就把微博关掉了。

未读池在理论上可以完美解决这些问题。一次刷新只出来15-30条内容，符合一次浏览的统计中位数。再刷，再出，再刷，中出。直到新内容刷空了，就从未读池里提取高权重的内容，再接下来是未读池里低权重的内容。

未读池的时间容量是3天，最多存放3天的内容。也就是你发一条微博，用户在这一刻没刷到，进了未读池，内容权重又不高(排在后面分发)，那就有可能第3天才被粉丝看到。当然，也有可能永远都看不到了。但你想想，如果用户“这一刻没刷到”，就算没有未读池，内容沉底在下面，很大的概率他还是“永远都看不到了”，未读池反而增加了这条微博的曝光机会。

未读池算法对浏览者的好处，一方面是你只要不停刷，就不会错过任何有价值的内容，减少了浪费；另一方面是空闲时多次刷新，多次刷出来新内容打发时光，而不是刷两下就没有了。对作者的好处，则是增加了整体曝光率——我测算自己的数据，浏览数大约增加了1/3。

多完美的解决方案啊，为什么渣浪被骂成了个猪头呢？

主要的原因是未读池打乱了时间线。微博和Facebook不一样，新闻价值更高得多，当内容在两三天内从未读池里分批提取出来，带有强烈时间属性的内容显然是错乱的。比如球赛结束两天后，你还能看见朋友为球员加油，顿时就炸了有没有。

这个问题非常尴尬，未读池显著提升了内容体验，但也破坏掉了时间线上的新闻体验。我又不是渣浪员工，没深入研究过feed流算法，我也提不出来解决方案。从渣浪一意孤行来看，未读池对数据的提升非常显著，再加上一家独大，不怕用户跑路，最后还是执行未读池方案。

所以成千上万人骂渣浪臭傻逼，我不赞同。臭傻逼能做到一百多亿刀的市值？渣浪得有多丧心病狂，才能摧毁用户体验而不自知，同时市值和用户数持续上涨？

但是换个角度来看，渣浪微博的战略很好，战术低能，一以贯之。未读池算法刚上线的时候，犯了特别多的低级错误，到现在可能还有不少低级错误，挨骂一点都不冤枉。感觉上“瞎鸡巴搞，完成任务不过脑”也是渣浪传统，和微信团队的精英化是冰火两重天。

4、
文章写完了，想都不用想，就知道涌上来不少人，冲着我说“收了多少钱为渣浪洗地？”

看我口型：
“洗你妈逼”
“洗你妈逼”
“洗你妈逼”

另外，本文如出现数据错误很正常，我他妈又不是渣浪分析师，所有数字都是凭记忆随手写的。我是跟你们讲这个道理，feed流调节算法的动机是什么，好处和坏处是什么。文章也是写给产品爱好者看的——你看，我作为一只网红产品狗都会为渣浪洗地，下次再骂feed流乱七八糟的时候，可不可以想想，还有什么更好的解决方案，而不只是泄愤？

比如说，上次视奸到微博CEO在评论里跟产品负责人说：“某些特定的新闻关键字，是不是就不要进未读池了？”说明渣浪也在想办法，改进未读池带来的时间线错乱问题。很难根治，或可改善。

视奸渣浪的feed流算法

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

跟着大神学产品

今日看点

首页投稿（暂停使用，暂停投稿）

@产品

产品狗的收集

IT共论

产品学习

消息专题