美文网首页
头条又上头条啦!都是算法惹的祸?

头条又上头条啦!都是算法惹的祸?

作者: joylovemax | 来源:发表于2018-06-17 11:53 被阅读0次

    近日,频频上热搜的抖音字节跳动公司又被点名了。这次是被人民日报狠狠地通报批评:直指抖音广告出现对英烈邱少云不敬内容,现已被立案查处。

    人民日报发布微博

    2018年,可谓北京字节跳动科技有限公司的多灾多难的一年。从年初抖音受追捧,到被叫停内涵段子,到西瓜视频被整改,再到抖音视频的多次被点名…似乎都在告诉我们一件事情:完全靠算法推荐的内容运营是被质疑的!

    我们都知道今日头条推送的文章,采用的是算法分发,内容来自PGC(专业内容团队)和UGC(用户产生内容),平台不产生内容,靠推荐算法分发流量获取用户的关注,抖音也不例外。

    这种推荐算法一味迎合读者的“喜好”,不断推送你关心的,喜好的内容。而对于涉事较少的特别是对未成年来说,则在这些不断迎合的内容中更是无法自拔。他们缺乏判断力,对于媒体推荐的内容更是有着潜在的信任感,在自己标签不断被确定,整个页面都充斥着同一种偏好的内容时,会不会对自己的内心或者三观进行不断强化呢?这里暂且不说“喜好”标签是否准确,只是在未成年人群中,这种推荐算法或许有着非常强的接受度,帮助他们减少了获取同类喜好内容的成本,并带来了前所未有的快感,这也就有了前段时间说的“抖音5分钟,线下5小时”的说法。

    大家或许不信,我们看一组数据,这组数据的来源我还没找到,对于调研背景,调研方式,调研样本量,调研选项都不清楚,只是从结果看:超半数的95后想从事主播网红,这也确实从某个角度反映了当下一种趋势和择业观,值得我们深思。

    调研数据

    由此也越来越多的人将矛头指向推荐算法。他们认为算法给人带来的是去中心化的内容推送,去除了过去人工进行内容运营的主管干预,让更多损害三观的内容得到了曝光和推广,从而使得更多的未成年朋友受到了思想上的玷污。

    对于这种看法我并不赞同。从结果导向上看确实如此,但是你如果知道推荐算法是如何产生的你就不那么想了,真的就是去中心化了吗?真的就没有主观的人工干预吗?这究根诘底确实是因为推算算法导致的吗?

    下面我们将以今日头条的推荐系统为例,看看推算算法是怎么影响用户的。

    今日头条推荐系统概览

    今日头条的推荐系统,如果用形式化的方式去描述实际上是拟合一个用户对内容满意度的函数,这个函数需要输入三个维度的变量。

    维度1:内容。头条现在已经是一个综合内容平台,图文、视频、UGC小视频、问答、微头条,每种内容有很多自己的特征,需要考虑怎样提取不同内容类型的特征做好推荐。

    维度2:用户特征。包括各种兴趣标签,职业、年龄、性别等,还有很多模型刻划出的隐式用户兴趣等。

    维度3:环境特征。这是移动互联网时代推荐的特点,用户随时随地移动,在工作场合、通勤、旅游等不同的场景,信息偏好有所偏移。

    上面看起来很简单,只有三个维度,但一个推荐模型实际上除了点击率、阅读时间、点赞、评论、转发包括点赞都是可以量化的目标外,还需要引入很多无法直接通过模型指标评估的其他因素。比如广告和特型内容频控。像问答卡片就是比较特殊的内容形式,其推荐的目标不完全是让用户浏览,还要考虑吸引用户回答为社区贡献内容。这些内容和普通内容如何混排,怎样控制频控都需要考虑。

    此外,平台出于内容生态和社会责任的考量,像低俗内容的打压,标题党、低质内容的打压,重要新闻的置顶、加权、强插,低级别账号内容降权都是算法本身无法完成,需要进一步对内容进行干预。

    这样听起来是不是就觉得复杂,高大上很多了。(今天我重点要说的不是头条的推荐算法模型,因此大致知道他们的推荐系统原理就好)

    到这一步其实我们已经可以知道算法工具的背后并不完全是去中心话的,算法虽说就那些:传统的协同过滤模型,监督学习算法Logistic Regression模型,基于深度学习的模型,Factorization Machine和GBDT等。但是它仅仅一个工具而已,如何发挥还取决于使用该项工具的人或团体。

    所以推荐算法本身并没有对错,你能说警察和恐怖分子手中的枪有什么对错吗?它只是一个被主人利用的“工具”而已。

    相关文章

      网友评论

          本文标题:头条又上头条啦!都是算法惹的祸?

          本文链接:https://www.haomeiwen.com/subject/hkoieftx.html