美文网首页Spark大型项目实战
013.用户访问session分析:需求分析

013.用户访问session分析:需求分析

作者: iarchitect | 来源:发表于2018-08-30 13:27 被阅读0次

1、按条件筛选session
2、统计出符合条件的session中,访问时长在1s-3s、4s-6s、7s-9s、10s-30s、30s-60s、1m-3m、3m-10m、10m-30m、30m以上各个范围内的session占比;访问步长在1-3、4-6、7-9、10-30、30-60、60以上各个范围内的session占比
3、在符合条件的session中,按照时间比例随机抽取1000个session
4、在符合条件的session中,获取点击、下单和支付数量排名前10的品类
5、对于排名前10的品类,分别获取其点击次数排名前10的session

声明第一点,上节课的话,其实我们就已经进入了正规的企业级大数据项目的开发流程,第一个步骤就是数据调研(就是对底层基于的基础数据的表结构进行调研、分析和研究);然后本节课,相当于是项目开发流程的第二个步骤,就是需求分析(在实际的企业中,需求分析,可能会比这里更加复杂很多;在互联网企业中,需求分析,首先就是要跟PM,就是产品经理,也就是负责设计你开发的大数据平台产品的人,去大量开会,去沟通需求的细节;此外,你自己还得根据产品经理编写的需求文档,可能还会自己设计一些产品原型图出来,让你看,去看,去研究;然后第三点,可能还需要作为一个项目的技术leader,去跟你的项目组内的成员,去讲解和讨论需求,要确保组内所有成员,都对需求清晰的理解了)

1、按条件筛选session

搜索过某些关键词的用户、访问时间在某个时间段内的用户、年龄在某个范围内的用户、职业在某个范围内的用户、所在某个城市的用户,发起的session。找到对应的这些用户的session,也就是我们所说的第一步,按条件筛选session。

这个功能,就最大的作用就是灵活。也就是说,可以让使用者,对感兴趣的和关系的用户群体,进行后续各种复杂业务逻辑的统计和分析,那么拿到的结果数据,就是只是针对特殊用户群体的分析结果;而不是对所有用户进行分析的泛泛的分析结果。比如说,现在某个企业高层,就是想看到用户群体中,28-35岁的,老师职业的群体,对应的一些统计和分析的结果数据,从而辅助高管进行公司战略上的决策制定。

2、统计出符合条件的session中,访问时长在1s-3s、4s-6s、7s-9s、10s-30s、30s-60s、1m-3m、3m-10m、10m-30m、30m以上各个范围内的session占比;访问步长在1-3、4-6、7-9、10-30、30-60、60以上各个范围内的session占比

session访问时长,也就是说一个session对应的开始的action,到结束的action,之间的时间范围;还有,就是访问步长,指的是,一个session执行期间内,依次点击过多少个页面,比如说,一次session,维持了1分钟,那么访问时长就是1m,然后在这1分钟内,点击了10个页面,那么session的访问步长,就是10.

比如说,符合第一步筛选出来的session的数量大概是有1000万个。那么里面,我们要计算出,访问时长在1s-3s内的session的数量,并除以符合条件的总session数量(比如1000万),比如是100万/1000万,那么1s-3s内的session占比就是10%。依次类推,这里说的统计,就是这个意思。

这个功能的作用,其实就是,可以让人从全局的角度看到,符合某些条件的用户群体,使用我们的产品的一些习惯。比如大多数人,到底是会在产品中停留多长时间,大多数人,会在一次使用产品的过程中,访问多少个页面。那么对于使用者来说,有一个全局和清晰的认识。

3、在符合条件的session中,按照时间比例随机抽取1000个session

这个按照时间比例是什么意思呢?随机抽取本身是很简单的,但是按照时间比例,就很复杂了。比如说,这一天总共有1000万的session。那么我现在总共要从这1000万session中,随机抽取出来1000个session。但是这个随机不是那么简单的。需要做到如下几点要求:首先,如果这一天的12:00-13:00的session数量是100万,那么这个小时的session占比就是1/10,那么这个小时中的100万的session,我们就要抽取1/10 * 1000 = 100个。然后再从这个小时的100万session中,随机抽取出100个session。以此类推,其他小时的抽取也是这样做。

这个功能的作用,是说,可以让使用者,能够对于符合条件的session,按照时间比例均匀的随机采样出1000个session,然后观察每个session具体的点击流/行为,比如先进入了首页、然后点击了食品品类、然后点击了雨润火腿肠商品、然后搜索了火腿肠罐头的关键词、接着对王中王火腿肠下了订单、最后对订单做了支付。

之所以要做到按时间比例随机采用抽取,就是要做到,观察样本的公平性。

4、在符合条件的session中,获取点击、下单和支付数量排名前10的品类

什么意思呢,对于这些session,每个session可能都会对一些品类的商品进行点击、下单和支付等等行为。那么现在就需要获取这些session点击、下单和支付数量排名前10的最热门的品类。也就是说,要计算出所有这些session对各个品类的点击、下单和支付的次数,然后按照这三个属性进行排序,获取前10个品类。

这个功能,很重要,就可以让我们明白,就是符合条件的用户,他最感兴趣的商品是什么种类。这个可以让公司里的人,清晰地了解到不同层次、不同类型的用户的心理和喜好。

5、对于排名前10的品类,分别获取其点击次数排名前10的session

这个就是说,对于top10的品类,每一个都要获取对它点击次数排名前10的session。

这个功能,可以让我们看到,对某个用户群体最感兴趣的品类,各个品类最感兴趣最典型的用户的session的行为。

相关文章

  • 013.用户访问session分析:需求分析

    1、按条件筛选session2、统计出符合条件的session中,访问时长在1s-3s、4s-6s、7s-9s、1...

  • 011.用户访问session分析-模块介绍

    模块介绍: 1、对用户访问session进行分析2、JDBC辅助类封装3、用户访问session聚合统计4、按时间...

  • 使用Python+R做用户购买路径分析

    1、需求: 在用户行为分析中重要的一环是对用户行为路径的分析,如先访问什么再访问什、现购买什么再购买什么。找到用户...

  • 「网易云音乐」-首页

    一、APP需求分析 用户:听歌,找歌,获得共鸣 平台:持续访问,买歌买会员,自传播(口碑) ——平台需求与用户需求...

  • 对用户行为记录进行物理切分session

    背景 需要对用户的访问日志记录进行转化分析,由于日志记录没有业务session,需要物理地对访问记录进行sessi...

  • H5优惠券发放策略设计

    一、需求分析与前期调研 用户场景需求分析 通过以上需求分析,整理出主要的用户需求/产品需求(如下) 需求优先级排序...

  • 漫谈需求分析(2):需求分析

    一、需求分析 需求分析就是解决问题的过程。 需求分析中最直接是步骤就是: 用户需求 ——用户目标—— 产品功能实现...

  • 微信的规划与运营2018-01-17

    一.微信的内容规划 分析运营的需求:明确账号的核心诉求 分析用户画像 分析用户的属性 分析用户的需求 确定内...

  • 『产品经理』2.需求挖掘与分析

    (1)需求挖掘与分析 ①如何获取需求?--产品定位和分析 ※需求分析 ※用户调研 ※市场分析 需求分析:需求第一大...

  • 用户分析,需求分析

    接下来就是关于用户分析及需求分析的部分 产品功能设计的核心是用户 需求分析是产品经理专业技能的非常重要要求 如何通...

网友评论

    本文标题:013.用户访问session分析:需求分析

    本文链接:https://www.haomeiwen.com/subject/hzbrwftx.html