刚完成本周的作业批改,本周作业提交率16.67%,撇去无效作业后仅剩6份作业,哭晕在厕所。
这里要表扬下三虫,作为我们组的独秀,拿到了懂球帝第一题的优秀作业!非常值得大家互相借鉴。
但是更值得表扬的是果子童鞋,完成了剩余的4份作业,且作业完成度都很高!鼓掌!~~~
接下来看本周的作业问题,作业共分6题,懂球帝的3题和小红书的3题,介于目前最多只完成了懂球帝的全部三题和小红书的第一题,所以我就这几题做下简单的分析:
1、 懂球帝的第一题,建议大家都看下三虫的作业,非常完整的优秀作业典范。我们不要被(无数据建模技能的同学可以选做)这样的文字吓到。其实就是简单的数据透视表就可以支撑我们做一些简单的交叉对比了。
这里特别要说明的是我们在做海量数据分析时,可以归类出一些数据定义,比如活跃用户(连续留存)、留存用户(普通留存)、流失用户(已流失),当我们分出类别后,相应的数据对比就更有的放矢了,且在透视表的图示表现上更为清晰。
2、 这周作业的题目其实蛮难为三节课出题的童鞋,又要把数据分布的足够明显,又面对的动辄是10几万的数据,所以在数据定义上考虑了相互间的显著差别,但是忽略了部分用户行为的数据合理性,可能这就是虚拟数据和实战的差别。当然这不影响我们这次的作业。
另外一个作业的诀窍,其实每道题的三个小题很多时候,就是层层揭秘的过程,也就是第2小题其实是第1小题的答案,第3小题其实是第2小题的答案,所以如果对于作业遇到困难了,看下下一题,就知道思路了。而我们作业的本身,更多的是思路的整理和数据的处理,无关是否是100%的正确性。
3、 还需要注意的是题目之间的衔接,大家花费了很长的时间进行数据处理,但是在策略部分有戛然而止就很可惜了,策略都是从数据中发掘的,所以我们定的策略一定要符合SMART原则,一定要具体啊,弄个放之四海而皆准的策略,那懂球帝和小红书是不是都能通用呢?
4、 小红书这题在于生命周期的定义,我对生命周期的看法就是,其实很多数据都有不同的权重,电商注重交易,内容注重浏览,那么我们在设计小红书生命周期时,就会遇到购买黑卡对于权重的影响了,诚然购买黑卡是个非常重要的环节(类似购买京东plus会员),但购买了黑卡就一定是成熟期的会员了么?我觉得未必,只能说购买黑卡在交易中的权重比较高,但不是成熟期的唯一标准。
理解了这个,其他就可以通过数据,定义出交易(交易金额,交易频次)+浏览(浏览时间,登录次数,访问页面)这样不同的用户类型标准了。这题再增加个按照你的定义标准从数据源中得出的生命周期各个阶段人数的图表,是不是就更完美了呢?
讲完这些,大家有没有发现?其实作业本身都不难,难得是我们没有做作业的决心!
而课程还剩2周,希望有人能跑到最后,我在终点等着你!
乔木
20180830
网友评论