美文网首页
基于任务的基础数据分析——在线教育平台

基于任务的基础数据分析——在线教育平台

作者: 你是王小花啊 | 来源:发表于2020-07-15 15:35 被阅读0次

背景:通过数据,教学运营人员可以客观了解一个班期中学员的整体情况,一边更具针对性地实施班级运营动作。


1.基于事件分析,选取事件「浏览课程内容」的「用户数」,按「总体」查看。观察【2018年11月29日-2018年12月13日】前两周进入课程学习的用户数变化,总结规律。

由图表可以简单看出,浏览课程用户数的极端值分别出现在12月1日(六)94人、12月6日(四)162人。

将数据简单整理制表后:

1.1前两周内,用户学习课程的时间规律(时间划分:天)

● 用户主要学习期间为周一至周五,周末学习的用户数最少;

● 每周的周一至周四为用户集中学习期间;

● 每周的周四因需要提交作业和开营时间,因此大部分用户会在这天学习并提交作业;

● 每周的周五因为是新一周的课程开放,用户在周四集中提交作业后会暂缓学习,或者又因为周五为工作周的最后一天,需要做本周工作总结赶进度,因此学习人数会低于均值;

● 每周六的学习人数均为低值,可见用户选择在这天放松休息;

● 第一周的周日学习人数低于第二周的周日学习人数,可能因为第一周课程内容和作业较第二周简单些,因此用户不会选择在第一周的周末花太多时间学习和写作业,而是安排到了下一周的周一至周四;

● 第二周的每日学习人数相较于第一周的起伏较缓,但是第二周的周学习人数低于第一周,可以猜测有部分用户没有坚持到第二周的学习,可能是发现课程不适合自己然后退款,或者是学习毅力不够。

1.2任选两天,观察并描述「平时」与「周末」用户学习课程的时间规律(时间划分:小时)

时间划分:

「平时」:周一至周五;

「周末」:周六至周日。

「平时」12月4日浏览课程内容用户数 「周末」12月8日浏览课程内容用户数 「平时」浏览课程内容的用户前10位 「周末」浏览课程内容的用户前10位

将「平时」「周末」数据筛选,得出前10个学习人数最多的时间,并单独观察12月4日(周二)和12月8日(周六)的单天数据,可知:

● 「平时」的时候,学生主要集中在19:00-23:00时间段内进行课程学习,其中21:00-22:00左右为学习高峰期。

● 「周末」的时候,随着上午起床,在10:00左右迎来上午时段的学习高峰期,13:00-22:00为主要学习时间区间,其中以18:00划分(18:00之前为下午,之后为晚上),学生大多数选择在下午进行学习;16:00为下午学习的高峰期;21:00为晚上学习的小高峰期。

2.基于事件分析,完成以下任务:

2.1试计算12月6日(周四)同比开营日(周四)的学员看课DAU提升/下降率。

12月6日 DAU=162

11月29日 DAU=134

提升率=(162-134)/134*100%=20.90%

2.1试计算开营日的7日留存率(开营日看课的用户中,下周四依然看课的用户比例)

11月29开营日为第0天

11月29日看课用户数为134,将用户ID筛选去重后,有31位用户没有在12月6日看课,得到12月6日依然看课的用户数为103

7日留存率=12月6日/11月29日=103/134=76.87%

2.3试与其他班期开营日的7日留存率比较,并推测合理原因。(已知其他班期的开营日的7日留存率为88.4%)

本次开营日的7日留存率低于其他班期,为了推测原因,作出以下假设:

1)是否是处于节假日的特殊时期,以至于学生在忙于其他的事情而忽略了看课?

课程开营为11月29日,处于年底阶段,可能公司有大量的事情导致没时间学习。

2)是否策划完活动大促,学生低价购买了多门课程,结果开营日期相近,导致离班调课?

2018年11月三节课策划了三周年大庆活动,大量优惠活动,很有可能有部分用户大量买课而没时间学。

3)是否是由于该班课的内容由浅入深后,学生发现不符合自身经验水平?

该班期为数据课第一期,有可能学生之前也没有接触过相关的业务,因此很有可能被课程和作业难度劝退。

3.基于事件分析,尝试分析该班期的用户构成属性

3.1描述这个班期学员的来源。(观察用户属性:首次广告系列来源)

将数据按照「首次广告系列来源」的维度进行筛选后,得到以上数据,可以看出:

● 在本次班期中,未知来源占比最大,其次的主要来源为订阅号、baidu、search、sjk;

● 渠道来源的类型与占比:

    ○ 直接访问:占比3.83%(sjk)

    ○ 引荐流量:占比1.28%(kol、shimo、知乎)

    ○ (自然和付费)搜索流量:占比14.04%(baidu、search)

    ○ 社交媒体:占比29.36%(订阅号、服务号、pengyouquan、pengyouquan1、weixindingyue、产品圈)

    ○ 其他无法分类:占比7.23%(PZ-PC、pmpyding、517yyp2、hydy、sq、sy36、xinxiliu、yyp1fw、yyp2dy)

    ○ 未知:占比44.26%(未知)

除去未知来源,社交媒体流量占比最大,可见大部分的用户都来自于新媒体矩阵,也正是三节课获客的主要方式。

3.2描述这个班期学员的构成,至少从三个维度描述。(城市、操作系统等)

1)按【城市】维度筛选数据:

● 以北上广深一线城市的学员占比为主;

● 杭州、成都作为互联网行业发展较好的二线城市也占据了一定的比例;

● 学员从地域分布来看,和互联网发展程度密切相关。

2)按【操作系统】维度筛选数据:

● 学生主要通过pc端进行学习,占比57.56%,移动端占比42.43%;

    ○ 可能原因是作业只能通过pc端完成,但是两端没有出现明显的差值,说明移动端的学习场景较为符合学员通勤途中或其余零散的空闲时间进行学习。

● 其中pc端Windows用户占比最多,而移动端以iOS为主。

3)按【首次访问时间】维度筛选数据:

*注:此次课程开始上线售卖期为2018年11月,那么认为2018-11-01至2018-12-01期间首次访问的用户为新用户,剩余为老用户。

● 新用户只占总体的22.13%,老用户是课程学员的主力军;

    ○ 可能是由于此次的课程为第一期,老用户因为以往的学习经历、课程口碑,因此对课程的信任度是很高的。

背景:以班期为单位,销售同事会进行销售复盘,探寻课程售卖规律,指导后续工作。教育行业中,满班率是关键。


4.在漏斗分析中:观察销售同事建立的订单复盘漏斗——【开始注册-注册完成-首页访问-创建订单-支付完成】,分析开营前一个月(11月1日-11月29日)每周新用户订单购买转化率。

4.1对比分析:哪周新用户的订单购买转化率最高,哪周转化率最低?(非自然周,以本周五-下周四为周期)

第一周:11月2日-11月8日;第二周:11月9日-11月15日;

第三周:11月16日-11月22日;第四周:11月23日-11月29日。

其中,第四周无转化率,第一周的转化率最低,为0%,第二周的转化率最高,为41.18%。

4.2结合「事件分析」,探究开营前一个月该班期用户支付订单的规律,并推测原因。

step1:查看一个月内,支付完成的用户数量

观察支付完成事件的数据,可知支付订单行为主要集中在11月15、16日两天。

● 11月15日创建订单人数80,支付人数78;

● 11月16日创建订单人数73,支付人数73。

● 猜测既然数据是从中间日期开始陡然上升,那么很有可能是用了运营手段,为了验证猜测,可以查看新用户注册情况。

step2:拉取【注册】开始注册的用户数:

● 发现依然是从11月15日陡然上升,注册集中在15、16日两天;

● 验证了上一步的猜想,确实进行了某种活动策划,带来了大量的新用户注册。

● 为了知道是哪种类型的策划,反推可以从新用户是从哪里找到的三节课的角度去拆解。

step3:按照【最近一次广告系列内容】维度进行筛选:

观看数据可知,78.46%的新注册用户都是来自订阅号推文;

step4:查找公众号历史数据:

在2018年11月15日确实发布了一篇新课推文,并且11月正值三周年大促期间,课程的优惠力度大。

综上,用户支付订单的规律:

● 用户创建订单主要受优惠活动影响;

● 用户创建订单后,高达91.3%的概率会完成支付,因此可以认为,只要用户发起创建订单行为,就会完成支付。

背景:观察某一位学员的行为轨迹,总结其行为特征与规律,能帮业务同事在脑海中形成用户画像,实时更有针对性的业务方案。

1.根据以往的教学经验,第三周是学员能否完成学习、顺利毕业的“关键周”。第三周学习顺利,往往就能坚持到最后,完成全部课程。(基于事件分析完成)

1.1明确这一班期中,从哪周(前三周中)开始学员的停学率最高。这一情况,是否与经验稳和?为什么?

*停学率=本周听课且下周放弃听课的人数/本周听课人数

第一周:11月30日-12月6日,听课人数222,停学率=18/222=8.11%

第二周:12月7日-12月13日,听课人数210,停学率=26/210=12.38%

第三周:12月14日-12月20日,听课人数189,停学率=29/189=15.34%

第四周:12月21日-12月27日,听课人数177,停学率=29/177=16.38%

第五周:12月28日-2019年1月3日,听课人数161,停学率=26/161=16.15%

第六周:1月4日-1月10日,听课人数147,停学率=23/147=15.65%

综上:

1)前三周中,第三周的停学率最高,为15.34%;

2)与过往经验稍微不太吻合,在整个班期中停学率最高的是第四周。

猜测原因:此时恰巧处于年末结尾,新年开始,学生可能忙于公司年底的各种事情,或者由于元旦假期有出游娱乐计划,因此在本周的停学率较高。

1.2在停学率最高那一周,选择某一停学用户作为代表进行分析,你会选择哪名(给出用户ID),说明选取理由。

将第四周的用户ID筛选处理,条件为:在第五、六周均未学习,得到了一份用户列表,共计21人,并且逐一查看这些用户在11月29日-12月27日的看课情况,最终将这些用户分成四类:

第一类:占比28.57%

课程开始看过几次,但中间有一段时间没看过,后来又接着看,最后放弃。

用户ID:

1033536、10733051、10900115、11335119、12327213、12328420

*以1033536为代表的第一类用户

第二类:占比38.10%

不看课的时间没有超过连续5天以上大间隔,较为规律。

用户ID:

1594667、1799389、5559807、10893232、10884503、11443000、12324973、12325378

*以1594667为代表的第二类用户

第三类:占比14.29%

课程开始的前部分时间没有看过,从中期开始看了几次。

用户ID:

12038374、1148657、12331950

*以12038374为代表的第三类用户

第四类:占比14.29%

从课程开始,只看过一、两次。

用户ID:

1907443、1232550、112074422

*以12074422为代表的第四类用户

综上分析可知:

第二类用户占大部分,而且具有这种行为的用户其实是最有可能提升看课频率的,因为他并不是有一大段时间放弃学习,如无特殊原因,这样的话后期追赶上来也是可以坚持到最后的。

因此,选择第二类用户,以1594667为代表。

1.3查看这名用户的行为序列,描述这位用户的学习特点。

1)筛选与处理数据:

筛选时间范围为开闭营时间:2018年11月29日-2019年1月22日;

事件筛选:web元素点击、web视区停留、完成思考题、浏览课程内容、笔记保存、笔记模式点击;

将用户行为序列数据按照「课程名称-浏览课程-时间」筛选制表。

整理数据可以看出,

● 2018年12月26日之后,用户就没有学习本次课程了;

● 而用户的学习行为占比最大的是web元素点击,同时视区停留次数占比也有31.77%,结合其他行为事件猜测,该用户可能是在写作业,或者在作业交流区浏览其他同学的作业。

● 该用户在此时间段内,没有用过内部工具记笔记,猜测是习惯用其他笔记工具。

● 其余用户数据:该用户在北京生活和工作,大多数会用Windows电脑进行学习,偶尔几次会在iPhone上进行课程的浏览。

2)在上一步的数据处理中发现该用户在该时间段同时学习浏览过多门课程,进一步整理:

发现:

● 该用户所有的课程均没有学完,其中学习次数最多的是业务数据课,而且有门课程只学习了一次;

● 从学习次数分布来看,该用户没有具体的学习规划,学习时间呈散点式分布;

● 多门课程里其中有两门内测课,说明该用户是曾经学习过的老用户,或者一直密切关注三节课动态的积极新用户。(后来通过注册时间筛选,该用户在2017年3月16日用WeChat浏览器注册成功,证实他为老用户。)

3)进一步将学习时间按照小时来分解(按小时划分,数据只能取到开始时间30天内的):

发现:

该用户习惯在周末的下午开始学习到凌晨,而且多次在凌晨开始学习,说明该用户平时的工作很忙。

综上,该用户的学习特点:

● 从微信公众号了解到三节课,并在三节课学习过,在北京工作很忙,平时没时间看课学习,偶尔在周末的下午开始,坐到电脑旁,开始学习到凌晨;一边浏览课程,一边在另外的笔记工具上记录课程重点;

● 偶尔想不出作业思路的时候,会去作业讨论区仔细的学习其他同学的优秀作业,找找灵感;

● 虽然自己已经很忙,但是依然很积极的同时报名了多门课程;然后因为缺少对学习时间的规划,导致不得不有所取舍,其中两门课程的学习次数小于三次;

● 最后在工作和多门课程学习的双重压力下,放弃了继续学习。

1.4猜测这位学员的停学原因,并给出针对这类学员的学习激励建议(产品/运营层面均可)。

停学的原因:

同时报名了多门课程,并且课程的学习班期日期有重合,最后在工作和学习的压力下,才逐步放弃了学习。

针对这类学员的学习激励建议:

● 产品层面:

    ○ (登录状态下)当用户在课程销售页,选择班期的时候,可以判断该用户当前是否处于某课程服务期内,获取所在班期的时间,再判断用户所选的班期是否与所在的班期学习时间重合,提示请合理安排学习时间。

    ○ 这一步可能会降低订单购买转化率,但是相应的可能会提升学生的结课率,降低停学率。

● 运营层面:

    ○ 班班可以提前多了解一下本班期的学员情况,比如是否同时学习多门课程,虽然这会带来大量的工作量,但是有的同学很少会主动跟班班说明情况调整班期(大部分估计也不知道可以调整)。

    ○ 如果学员没有调整班期,依然同时学习的话:    

        ○ 对于有一定学习规划能力但自制力较弱的,班班和助教要多多鼓励与督促(有小部分同学会觉得有被打扰,这类学生一般是做作业和提问不积极的,可以选择性的进行督促)。

        ○ 对于学习规划能力较弱的学生,助教或班班可以协助制定学习日程表,安排好学习时间,及时追踪完成情况并督促。

ps:一个有意思的事

在观察上面的用户1594667注册时间时,发现他在2017年3月16日注册完成后,在2019年和2020年又分别进行了注册行为。

再次筛选时间为「上线至今」,进行全部事件筛选:

发现,该用户从2018年8月至今,行为很活跃。

于是,查找2019年12月25日和2020年1月10日,数据显示该用户的最近一次广告系列来源均为shimo。

猜测:该用户后来成为来三节课员工,之所以会在2019年12月25日和2020年1月10日进行注册行为,是为了验证在石墨投放的广告引流后注册的流程。

相关文章

网友评论

      本文标题:基于任务的基础数据分析——在线教育平台

      本文链接:https://www.haomeiwen.com/subject/ywtrlxtx.html