相比于传统行业,用户行为分析平台可能是互联网企业的一个特有的数据分析工具。能够对用户行为进行分析,进而展开精细化运营,可能也是互联网行业发展迅速的原因之一。随着传统行业逐步互联网化,用户行为分析的应用场景也越来越广,该平台在企业内扮演的角色也愈发重要。
得益于用户所使用的硬件和软件,我们可以记录到大量的行为数据。用户行为分析平台便是对这类数据进行深度地分析,从中挖掘有价值的信息,例如不同群体对产品的偏好,使用习惯等。这些信息最终能指导产品和运营等方向的优化。可以说,用户行为分析平台是数据驱动业务的代表产品。
典型的行为分析包括了留存分析、转化分析、路径分析等,以及基础的用户分群,这些功能若都能沉淀并在平台上产品化,将能大大提高企业对行为数据分析的效率和覆盖用户的广度,不具备专业数据分析技能的人员在简单接受产品培训后也可以完成相关分析。本文也会主要关注以上几个模块。
用户分群
用户分群的操作,本身其实不会直接产生价值,但却可以说是后续一切分析的基础。如果不进行分群,所有的分析都只基于汇总数据,很多细节在汇总时都丢失了。引用资深数据专家、Google Analytics的推广人之一Avinash Kaushik的名言:所有聚合的数据都是垃圾,要么分组,要么去死。(All data in aggregate is crap. Segment or die.)可见分组、分群的重要性。我们常见的分群例如:用户获取渠道来源,设备终端,新老用户等属性,以及是否有过具体某类行为等。对用户根据需求分群后,再进行留存、转化等分析,通常会事半功倍,也能发掘真正有价值的信息。
用户画像也可以被理解为用户分群的一种,用户画像会根据一系列用户标签和算法对用户进行画像描绘和分群。这里介绍的用户分群产品,可以看作是用户画像的消费方,在用户分群产品中可以根据已有的画像进行分群。具体的画像产品或许会在另一篇里讲述。
不论是根据用户所具备的自然属性,还是在产品使用过程中所表现的行为特征进行分群,都要求产品能做到足够广度和深度的数据记录,也就是我们在第一篇数据产品指北(一)— 埋点中要下的功夫。
在用户分群模块中,我们可以根据已有的数据,配置分群规则,创建新的群组。分群的操作,其实类似SQL中的条件查询。通过将代码功能产品化,降低了使用门槛。
如下图,是神策产品中的针对某直播业务的用户分群功能展示。
用户分群功能该分群结果为用户属性满足用户等级大于10且用户类型为普通用户,且在2017-4-17至2017-5-16之间有过至少5次送礼物行为且礼物类型为付费礼物,且在2017-4-17至2017-5-16之间有过留言和点赞行为的用户。我们视其为高粘性且高频消费用户,在平台上完成筛选后对该用户群命名并保存。运营人员可以查看该用户群的明细列表,更重要的是可以通过其他行为分析工具来观察这部分用户的行为表现,以及和其他用户的区别。这类分析对于我们在用户增长工作中定义目标人群、魔法数字、寻找增长机会、进行增长实验等环节都有非常大的帮助。
可以看到,用户分群本质上是一种条件筛选器,在每个筛选器中筛选出符合特定要求的用户群。筛选器中首先需要定义筛选的字段(具体的用户属性、行为特征等),再通过大小等于不等于、是否在之间、是否在其中等关键字完成条件的设定。若筛选的字段是数字,自然筛选范围也是数字,若筛选的字段是字符串,可以提供相应字段的列表进行筛选。筛选器间可以嵌套,可以通过AND、OR(表示并且、或者)等关键字连接。
留存分析
留存分析是通过对用户使用产品的情况、活跃程度等进行分析以判断用户是否仍留存在产品内的分析模型。用户留存在产品运营周期中的重要性无需多言,由于本文重点关注完成分析的数据产品,因此不会涉及过多具体分析的内容。
要进行留存分析,首先需要定义留存和流失的标准。不同类型的产品可能有不同的定义方式,有些公司会把留存简单定义为用户在一定时间后仍有打开产品。但有些公司可能需要更严格的定义,例如某电商公司可能将留存定义为用户在一定时间内有再次消费的行为。因此,在留存分析模块内,要可以对留存进行定义,即支持自定义起始和回访事件,同时还可分别设置过滤条件。例如对于一款短视频app,我们可将起始事件设计为打开app,回访事件设计为播放视频。当然,此时我们已经可以应用在用户分群模块中设置的用户群,进行对特定群体的分析了。下图展示了Growing IO定义留存的页面。
定义用户留存衡量留存,我们通常会计算同一用户群不同时间段的留存率,并以此绘制留存曲线,这便是我们常说的同期群分析(Cohort Analysis)。在同期群分析中,我们会把同一时期加入的用户放入模型,横向追踪他们在未来一段时间内是否仍然留存或流失,流失的时间和比例。例如常见的次日留存、7日留存,以及更长时间段更粗粒度的周留存、月留存等。用户起始事件的日期和回访事件的日期间隔N,便是该用户的留存日期,即N日的留存用户。
留存率的计算公式为:具体某天的N日留存率=该天起始用户在N日留存的用户数/该天的起始用户数。当然也可以选择周、月、甚至年等其他统计周期。
在明确留存事件、留存周期和统计时长后,就可以统计出每个周期的留存率和绘制留存曲线了,这些功能都可以由留存分析模块自动输出。例如下图,是Growing IO对过去180天用户的月留存进行的分析。更精细的分析还可以同时绘制出多条不同统计周期下起始用户的留存曲线,从而解读每个周期下不同留存表现背后的不同动作。
用户留存曲线详细数据可以查看如下的留存表格,表格中记录了每个统计周期内起始用户在后续每个留存周期内的留存表现,并通过单元格颜色深浅表示留存程度。
留存详情表若想从整体上了解用户留存的情况是否越来越好,还可以查看特定周期留存率随时间变化的趋势。如下图反映了过去30天,用户次日留存、7日留存和14日留存的趋势情况。
特定周期留存率的变化趋势针对特定周期下的留存用户,我们还可以查看详细的留存用户列表,做更细致的分析,更可以将该用户群保存为新的用户分群。
转化分析
转化分析是对完成关键行为的每一个环节建立转化漏斗,了解最终及每一步具体转化情况的分析模型。转化分析能让我们清晰认识到目前转化上的问题节点,并展开优化工作。
要进行转化分析,首先自然要定义转化漏斗。转化分析模块可以新建任意的转化漏斗,在新建过程中正确选择每个步骤的事件或指标即可。例如,下图是Growing IO中新建转化漏斗的页面。左侧是可选择的具体事件或指标,根据勾选顺序会在右侧构建漏斗。定义转化漏斗时,我们同样可以选择特定的用户分群进行分析。
新建转化漏斗需要注意的点是,用户完成整个转化链条不一定是连续的。例如用户在某电商网站购物,可能在第一天完成了商品的加购,但三天后才会完成下单支付。因此在转化分析模块,需要设置转化的窗口期,即用户完成整个转化链条的总时长。而转化分析的统计时间范围,通常是指转化步骤的第一步发生在该统计范围内,后续步骤不一定在此范围内。例如,下图是Growing IO中模拟的某电商网站简易购买转化漏斗。统计范围是过去14天,意味着统计浏览商品详情页(第一步)发生在过去14天的所有记录。转化周期是3天,意味着只统计在3天内完成了整个转化链条的记录。
购买转化漏斗转化漏斗中,可以了解整体的总转化率,每一步的绝对数量和阶段转化率。以上图数据为例,可以明显定位问题在于大量用户浏览商品后却没有加购,导致最终没有成单。
与留存分析一样,我们还可以查看转化率随时间变化的趋势图,以定位转化问题与特定时间点之间的关联。下图是该举例数据的转化趋势表现,可发现在统计周期最后3天,转化率下降明显。但由于我们选择的统计范围是最近14天且转化周期是3天,可能因为这个原因,导致部分最后3天进入漏斗的用户还未完成整个链路,影响了当天的转化率。
转化率趋势图简单的转化漏斗分析可能还不能满足精细化运营的需求,更理想的做法是对不同维度或用户群进行细分和对比分析,以了解不同群体间的转化区别,进而指导我们的运营方向(是的,用户分群又派上用场了)。例如,下图根据用户等级进行了漏斗对比,发现钻石用户的转化率居然还不如普通用户,这很可能意味着会员体系设计上的bug,相关产品人员可能需要好好反思总结下了。
转化漏斗对比行为路径分析
转化分析能告诉我们最终有多少用户成功转化,多少用户流失了。可这些流失的用户都去了哪?他们在流失前都有什么行为?甚至他们为什么会流失?这些问题转化分析都无法告诉我们,因此我们需要对用户的行为路径进行分析,以帮助我们更深入的了解流失背后的原因。
行为路径分析是用来追踪用户从某个事件开始到某个事件结束过程中的全部动线的分析方法。听上去和转化分析有点类似,但行为路径分析记录的信息要更广,记录的时长通常更短。
转化漏斗是人为定义的,而对于用户的行为路径,我们虽然可以通过产品设计进行引导,但却无法控制。因此我们分析用户的行为路径不光是为了作为用户转化分析的补充,更可以了解用户的实际动线、操作行为,让产品顺应用户,找到用户的愿望线。愿望线的概念来源于设计心理学,它反映了人们最希望行走的路径。最典型的例子便是我们在小区、公园等地都会发现除去修筑好的道路,总有一些人为踩踏草坪走出来的路,这便是用户真实希望的路径。在产品设计时,我们其实更多的应该是顺应用户的行为,而不是规划用户的行为。
要完成行为路径分析,需要先定义Session。Session即会话,是指在一段时间内,用户在产品中的行为总和。一次Session可能包含了多个页面访问、图片浏览、社交互动、支付交易等行为,以及会有在多个页面间来回流转的重复行为。我们会根据时长和具体事件完成Session的切分。行为路径分析和转化分析的另一个不同便是,行为路径一般会被定义一串连续的行为,因此不会像转化分析一样设置以天为单位的统计周期。比如对于Web产品,Session的切割时间可能就是30分钟,而对于App产品,可能切割时间只有1-5分钟。通过Session我们可以了解用户的实际使用时长和交互深度,但时长越长和交互事件越多并不一定代表产品对用户价值越大,需要具体问题具体分析。也有可能是因为动线设计不合理,导致用户增加了大量无效的操作。
其次需要挖掘在Session中用户的最大前驱路径。最大前驱路径的意思是,用户在产品内可以完成的所有行为路径的集合。例如用户访问Session有如下的路径{A,B,C,D,C,B,E,G,H,G,W,A,O,U,O,V},这里每个字母代表一个访问节点。寻找最大前驱路径的思路就是每当发生回退事件,则意味一条路径结束,需要回到回退事件之前的节点,再继续往下寻找。因此这里得到的最大前驱路径为{ABCD,ABEGH,ABEGW,AOV,AOU},一共5条路径,画成树如下:
最大前驱路径示例寻找最大前驱路径的工作,有特定的算法可以解决,我们更需要关心的是在完成这些准备工作后的行为路径分析产品化。在行为路径分析模块中,我们可以设置路径的开始和结束节点,以及统计的时间范围。如果是配合转化分析,可以设置为转化漏斗的第一步和最后一步。该模块同样也可以支持属性和用户分群的筛选。最终的分析结果以桑基图的形式呈现。例如下图是神策中对用户行为路径的分析。每一条串联起的流向都是一条用户路径,直至节点最多的用户路径为止。
用户行为路径示例用户行为路径分析能让我们更深入的了解用户的实际行为动向,发现更深层次的问题。在上图中大量用户在打开App后成功被Banner位活动所吸引,但最后只有30%用户通过活动落地页提交订单(假设是一个开通付费会员的活动),大量用户选择跳转到商品详情页。这说明活动落地页的设计存在问题,不足以直接转化用户开通付费会员,用户仍需要通过浏览实际商品了解付费会员的价值。
事件分析
事件分析是指对具体的事件或指标进行查询分析。事件分析是最基础的用户行为分析,但也可以说是最细致的分析,所以放到了最后来讲解。通过对预先设计的埋点事件进行不同维度和时间范围的筛选,可以简单快捷的查询我们想要的数据,本质上就类似于我们通过SQL完成取数工作。
要完成事件分析,首先要明确事件的定义。由于在数据埋点篇中已做了详细介绍,这里就不再赘述了。只需了解事件是通过埋点记录,一个产品中会包含大量的事件。一个事件内可能包含多个事件属性,以key-value的形式记录。例如埋点篇中的活动访问事件,包含了活动ID、访问来源等属性。而有一些所有事件都具有的属性,可以单独作为公共属性记录,例如设备终端、操作系统、app版本等。
事件分析模块的一个重要功能是需要支持自定义事件或指标。埋点是最细节的统计数据,同时有一定的开发成本,不会频繁变动。因此有些有分析需求的事件或指标不会直接由埋点一一记录,而需要人为的在事后定义。例如统计同时访问过A、B两个活动的用户数,需要定义一个新事件:既有A活动访问事件,又有B活动访问事件,对于这种由多个原始事件组合、过滤得出的新事件,通常被称为虚拟事件。以及在数据指标篇中提到的计算指标,例如某商品详情页的点击率,需要通过自定义详情页点击次数/商品展现次数得出。
在进行事件分析时,只需选择具体的事件或指标,以及指标的统计方式,通常包括求和/平均/人均等方式,在选择统计的时间范围就可以完成基础分析了。更细致的需求,还可以通过添加拆分维度和用户分群进行深度分析。如下图统计了商品点击和加购行为在过去七天的次数变化趋势,并按照男装/女装的类目进行了拆分。
事件分析示例由于留存分析、转化分析、路径分析其实都是对事件进行定义和组合后进行的分析,所以可以认为事件分析是其他各类分析的基础。在基础的事件分析中,我们一般会配置一些常用的分析指标,比如PV、UV、DAU等。而作为最原始和最基础的分析工具,事件分析的粒度也是最细的,因此除了了解常规的事件和指标的表现,我们有必要借助事件分析挖掘更细节的数据。
本篇主要介绍了一些在用户行为分析平台中应用最广的产品功能和分析方法,除此之外还有诸如用户行为细查、热图分析等相关功能。随着技术本身和从业人员分析水平的进步,未来必然会有更丰富更科学的分析工具和方式出现,例如借助AI能力帮助企业智能定位魔法数字和愿望线的功能。我们能做的只有不断进步,跟上行业发展的趋势,保证自己处在领域前沿。越早掌握新工具,越能获得先发优势。
用户行为分析平台篇到此结束。
相关阅读
参考文献
梁旭鹏. 《数据产品经理修炼手册》. 2019.03.
桑文锋. 《数据驱动:从方法到实践》. 2018.03.
曲卉. 《硅谷增长黑客实战笔记》. 2019.04
欢迎关注公众号:罗老师别这样;感受一个产品人的成长与反思;
公众号将持续更新深度学习笔记及个人心得,不轻易更新,但更新一定保证价值,望你和作者共同进步
网友评论