信息流应用的崛起(5)

作者: 北邮老土 | 来源:发表于2017-12-15 11:04 被阅读0次

前天一千多字,居然连“物以类聚”都没有讲完,今天继续。

基于关键字实现物以类聚,技术上虽然简单,但是效果并不好;基于语义实现物以类聚,虽然效果好,但是技术较为复杂,门槛很高。有没有更加简单的方法实现呢?那么有没有更加简单有效的方法呢?


既然从文本分析的层面上走不通,那么是否可以走其他的路线呢?比如说根据用户行为!

根据用户行为判定新闻关联度的原理并不复杂。通过分析用户看过的新闻的列表,从而可以了解一个用户都浏览了哪些新闻。如果能够找到一系列新闻ABC,这一系列新闻“频繁”的出现在很多用户的浏览记录中,那么就可以认为这些新闻有较强的关联性。当用户阅读了这一系列新闻中的某一篇之后,就可以优先向此用户推荐这一系列中的其他新闻。随着用户越多,随着收集到的用户行为越多,这种相关性分析就越准确!在技术层面上,这种分析技术被称为聚类分析技术。目前这种分析技术已经较为成熟。

讲完了“物以类聚”,下面说说“人以群分”。

人以群分

“人以群分”的原理也不复杂,简单说就是如果可以找到与此用户类似的一群人,那么这群人喜欢看的或者看过的新闻就是应该优先向此用户推荐的新闻。

只要读一下上面的原理,就知道这其中的复杂度主要是如何来判定一个人与一群人类似。换言之,就是确定人与人的关联度。一旦有了人与人之间的关联度,首先可以利用这个关联度找到人群(即这群人相互之间的关联度超过某一阈值),然后再去判断特定用户与这个人群之间的关联度。如果关联度超过某个阈值,那么就认为这个用户是这个人群的潜在用户,从而可以用这个人群的浏览列表构建向这个用户推荐的新闻列表。

既然整体原理非常简单,那么剩下的问题就是要如何判定人与人之间的关联度了。这个问题可以很简单,也可以很复杂。

一种很自然的判定人与人之间的关联度的方法是依据人的一些基本的属性,比如:性别、年龄职业、民族等。但实际上这些基本信息并不容易获取,一般来说在用户注册的时候并不会向服务提供商提供这些基本信息。因此对于今日头条这类服务提供商来说,他们需要构建相应的技术机制来“尽可能”全面的收集用户的个人信息。而个人信息所牵扯的范围非常广泛,既包括用户的基本信息,还包括用户的行为信息和各种有隐含意义的信息。

用户的行为信息包括用户是什么时间注册的,用户每天在什么时间使用应用,用户喜欢看哪种类型的新闻,用户在每篇新闻中会停留多长时间等。

而所谓的有隐含意义的信息涉及的就更广了!有太多的内容可以挖掘出隐含的信息,这里举几个简单的例子。

很多手机应用在安装的时候都会向用户请求“获取手机中安装的应用列表”的权限。不同类型人手机中安装的应用有很大差异。有的人手机中安装了大量的购物应用,这很可能说明这个人热衷于购物。即使是购物应用,不同的购物应用的含义也不同。安装了小红书,网易考拉的用户更可能热衷于海外购。此外,如果一个人的手机中一款网络游戏都没有安装,那么很有可能这个人的年龄超过四十,是网游渗透率最低的人群……

小红书

用户使用的手机型号也有非常丰富的隐含信息。首先可以看手机的价位,使用不同价位的手机的人群的消费能力会有很大的差异。同时使用的手机品牌也有不同含义。试想用美图手机的人几乎不可能是“油腻的中年男人”……

美图手机

在大量的收集到了用户的信息之后,通过分析这些信息就可以完成“用户画像”。接着根据用户画像将用户聚合成不同类别。然后就可以针对不同类别的用户完成推荐了。

终于将物以类聚和人以群分的基本原理说了一遍!但需要指出的是,原理可能并不复杂,也很容易理解,但真正在实施上往往有很多需要拿捏的地方,比如:物与物的关联度和人与人的关联度分析到底要使用哪些指标?不同指标的权重到底要如何设置?这些都是应用提供者在应用开发和运营过程中要具体考虑和不断调整的,这也是各个应用提供者的功力差异的具体体现。

[未完待续]

相关文章

  • 信息流应用的崛起(5)

    前天一千多字,居然连“物以类聚”都没有讲完,今天继续。 基于关键字实现物以类聚,技术上虽然简单,但是效果并不好;基...

  • 信息流应用的崛起

    姓名:王怀帅 学号:16040410035 转载自:http://www.jianshu.com/p/3a799f...

  • 信息流应用的崛起(11)

    从今天开始老土准备认真清算一下之前的烂尾文章。近期的烂尾文章主要有两个系列,一系列是“信息流应用的崛起”,目前是写...

  • 信息流应用的崛起(2)

    上一节说了说“信息流应用是什么”,只是开了个头,没有说透,今天继续! 如果将“信息流应用”定义为“流式浏览+信息聚...

  • 信息流应用的崛起(10)

    又隔了两天,今天继续回到的“信息流应用”的连载上。上文说到只有更加了解用户的需求才能更好的向用户推销(提高广告的转...

  • 信息流应用的崛起(7)

    用一千字介绍”信息流的出现“竟然还到不了”信息流的诞生“,看来老土东拉西扯的能力有提高了!虽然这也不算是什么好能力...

  • 信息流应用的崛起(8)

    搜索引擎的出现极大的改变了新闻浏览模式。很多用户不再将(新闻)门户网站作为浏览新闻的第一站,而是将搜索引擎作为第一...

  • 信息流应用的崛起(4)

    昨天赶一份项目文档,所以停更了一天。今天继续谈谈今日头条到底是凭什么完成筛选和推荐的。 对于今日头条是如何完成筛选...

  • 信息流应用的崛起(3)

    昨天完了“今日头条”作为新型“信息流应用”有两个特征。第一是“其聚合的内容并不是本应用自产的信息,而是大量的来自第...

  • 信息流应用的崛起(9)

    昨天谈到了,当内容和交互都准备好之后,信息流应用也就堂皇登场了。然而老土认为让信息流应用真正得以大火的核心原因既不...

网友评论

    本文标题:信息流应用的崛起(5)

    本文链接:https://www.haomeiwen.com/subject/peerwxtx.html