美文网首页大数据应用数据采集分析共享主义万岁
快速上手数据分析,你只需要这份框架...

快速上手数据分析,你只需要这份框架...

作者: DataHunter小数 | 来源:发表于2019-01-04 11:19 被阅读50次

    经常有人说,我不是专业的数据分析师,但工作中常常需要分析数据才能推进业务,有没有一种简单粗暴的方式可以让我快速上手数据分析呢?

    【有啊老铁!】

    一、 数据分析目标:以量化方式来分析业务问题

    现代管理学之父彼得·德鲁克说过一句很经典的话:如果你不能衡量它,那么你就不能有效增长它。所以,我们做数据分析是为了能以量化的方式来分析业务问题,并得出结论。其中有两个重点词语:量化业务

    1、量化

    量化是为了统一认知,并且确保路径可回溯、可复制。 统一认知后,才能保证不同层级、不同部门的人在平等话语权和同一个方向上进行讨论和协作,才能避免公司内的人以“我感觉”、“我猜测”来判断当前业务的情况。

    例如,这个产品功能上线后效果怎么样?A方案和B方案哪个更好些呢?诸如此类的问题,都牵涉到一个“标准”的问题,如果标准是这个功能必须有200人以上使用,那只有100人使用都不叫效果好。只有给出真实、可靠、客观的事实数据,才能对具体的活动作出最真实的评判。

    2、业务

    只有解决业务问题分析才能创造价值。价值包括个人价值和公司价值。对于公司来讲,解决业务问题可以提高收益或者降低成本;对于个人来讲,知道怎么利用数据解决业务问题,对个人的能力成长和职业生涯都有非常大的帮助。

    二、一切数据分析的核心是:分析方法

    在之前发布的《科普 | 说说商业数据分析师的7类岗位及基本技能》一文中提到,数据分析是基于商业目的,收集、整理、加工和分析数据,提炼有价值信息,并指导实践的过程。

    在实际应用中,数据分析可帮助人们作出判断,以便采取适当行动。但数据本身其实并没有任何价值,是分析方法的存在使得原本毫无价值的数据大放异彩。数据分析的三大作用,主要是现状分析、原因分析和预测分析。

    三、数据分析的重要基础:指标体系

    1、数据分析的第一步就是建立指标体系

    那什么是指标呢?假设隔壁老王开了一家水果铺子,你问他每天生意怎么样,他可以回答卖的“不错,很好”、“最近不景气”。这些都是很虚的词,因为他认为卖的不错也许是卖了50个,而你认为的卖的不错,是卖了100。老王想要描述生意,他应该使用销量,这就是他的指标。

    互联网想要描述产品,也应该使用活跃率、使用率、转化率等指标。

    在建立指标体系的过程中,我们知道孤立的指标发挥不出数据的价值,和分析思维的金字塔结构一样,指标也有固有结构,呈现树状。

    我们在考虑问题的时候都会遵循一个思路,例如从宏观到微观,从全局到局部,数据分析也不例外。例如产品运营中的数据分析指标体系:

    需要注意的是,指标体系没有放之四海而皆准的模板,不同业务形态有不同的指标体系。移动APP和网站不一样,SaaS和电子商务不一样,低频消费和高频消费不一样。好比一款婚庆相关的APP,不需要考虑复购率指标;互联网金融,必须要风控指标;昨日突破了2135亿成交额的天猫双十一,它属于电子商务,所以卖家和买家的指标也各不一样。这些需要不同行业经验和业务知识去学习掌握。

    2、不是所有的指标都是好的。

    美国硅谷增长黑客专家曲卉提出了产品的“北极星”指标。定义北极星指标有6个标准:

    ①这个指标可以让你知道你的用户体验到了产品的核心价值吗?

    ②这个指标能够反映用户的活跃程度吗?

    ③如果这个指标变好了,是不是说明整个公司是在向好的方向发展?

    ④这个指标是不是很容易被整个团队理解和交流呢?

    ⑤这个指标是一个先导指标,还是一个滞后指标?

    ⑥这个指标是不是一个可操作的指标?

    北极星指标和公司发展相关联,是公司在一个阶段内的重点方向。记住是一个阶段,不同时期的北极星指标不一样不同业务的北极星指标也不一样

    互联网公司在产品1.0期间,我们应把注意力放到打磨产品上,在推广前提高产品质量,这时留存率是一个北极星指标;在发展阶段,北极星指标是用户数和活跃率,用户数代表市场的体量和占有,活跃率代表产品的健康度;而在有一定用户基数的产品后期,商业化比活跃重要,我们会关注钱相关的指标,比如广告点击率、利润率等。

    四、如何保证数据分析全面性:维度分析法

    确定了数据分析的核心目标,就可以着手进行分析了。数据分析大体可以分三类:

    ①利用维度分析数据;

    ②使用统计学知识如数据分布假设检验;

    ③使用机器学习。

    (今天主要展开讲述第一类。)

    1、第一类:利用维度分析数据。

    利用维度分析数据是一种自上而下的思路,这种思路多是用于产品的数据分析体系或者模型的建立,从而保证数据分析的全面性。具体的思路为:

    维度是描述对象的参数,在具体分析中,我们可以把它认为是分析事物的角度。销量是一种角度、活跃率是一种角度,时间也是一种角度,所以它们都能算维度。

    当我们有了维度后,就能够通过不同的维度组合,形成数据模型。数据模型不是一个高深的概念,它就是一个数据立方体。

    例如,在做产品运营的数据分析时,我们可以按照以下思路来进行:

    我们以天猫店铺利润情况进行分析,店铺运营最关注的就是营业额,但最本质的还是盈利情况,按照上面提到的思路进行分析:

    ①数据分析目标:店铺的利润情况分析

    ②确定数据目标的关键影响维度拆解:

    ③找出不同维度之间的关联关系从而建立起数据分析模型:

    利润=销售额-成本=流量*转化率*客单价-(店铺固定成本+运营成本+货品成本+人员成本)

    ④根据数据模型发现问题数据:

    要想实现店铺利润(L)额最大化:

    L(max)=R(max)-C(min)

    如果店铺出现亏损,那么一定是R<C,也就是成本大于收入,我们假设出现以下情况:

    根据上述的假设思路,我们可以得出,在成本合理的情况下,店铺出现了亏损,那么可以得出是销售额太低,销售额不高额影响原因是流量转化率低。因此针对这种情况我们要做的就是提高店铺的转化率。

    ⑤针对问题数据影响维度做相应的优化:提升转化率

    我们可以通过以下几个方面来提高转化率:

    提升产品包装

    优化详情页图片和介绍文案

    优化消费者下单支付路径和体验

    提升客服服务水平和促单技巧

    做好用户评价管理优化

    实行相应的促销策略,如满减、满赠、折扣等

    ……

    说到维度法,我们知道单一的数据没有分析意义,只有多个数据组合才能发挥出数据的最大价值。在此,我想强调的一个分析的核心思维:对比

    做不同维度的对比大概是新人快速提高分析能力的捷径之一。比如,过去和现在的时间趋势对比、不同地区维度的对比、产品类型的区别对比、不同用户的群体对比等。

    因此,做数据分析,要更多地关注多个数据维度之间的相关关系,而不是单个数据产生的因果关系!通过影响关键指标的数据维度间的关联关系,建立数据分析模型。

    我们以公众号运营为例,公众号运营的关键指标是粉丝数和文章阅读量,而粉丝数和文章阅读量的影响维度有很多个。这些维度之间也存在相应的影响关系,具体如下:

    在做公众号运营的时候,可以尝试着把你影响文章阅读量的所有数据全部梳理出来,然后去筛选出相对有用的一些数据维度,然后建立起他们的相关关系。

    在实际运营过程中,很多运营的小伙伴每周只关注推送了多少篇文章,增长了多少个粉丝,其实还应该关注一些细节数据,比如文章标题、内容长度、内容类型跟阅读量、转发量的关系,推送时间和频次对阅读量和粉丝增减的影响,另外就是有图文、纯文字、文章图片数量、公众号单图文推送、多图文推送、头条推送和非头条推送对阅读量的影响等,这些都是需要在运营过程中需要考虑的,并且要养成对这些数据进行记录的习惯。

    在社区运营过程中最基本的模型就是用户的金字塔模型了,这个金字塔模型的建立是依据用户的活跃度和贡献值来建立的,金字塔模型会将用户分成几个层级,层级越往上用户的价值越大,贡献值越高。当然这个用户金字塔模型的建立一定不是固定的,而是根据具体的社区数据情况会在层级划分和每个层级占比上都会有所不同,并且每个层级的具体需求和运营方式都是不同的。比如以某K12教育社区的运营为例:

    社区发帖量这一核心数据指标提升,是与整个社区的用户量,用户层级比例,用户层级转化,每个层级用户行为,用户粘性,社区内容质量, 内容展示与推送情况等都存在一定的相关关系。所以在社区的运营过程中就要不断的促进各个影响维度与社区发帖量的正向关系,那么社区发帖量与其他数据维度的关联关系如何建立呢?我们尝试着做了一个简单的梳理,相应的数据维度并未全部包含,此关系图仍需完善,此处只是给出一种梳理思路,具体如下:

    2、第二类:使用统计学知识如数据分布假设检验。

    使用统计学知识如数据分布假设检验是一种自下而上的思路,这种思路多用在针对已有数据报表中的数据问题发现,具体思路:

    3、第三类:使用机器学习。

    五、日常数据分析中需要避开的坑

    1、控制变量

    在做 A/B 测试时没有控制好变量,导致测试结果不能反映实验结果。或者在进行数据对比时,两个指标没有可比性。

    2、样本

    在做抽样分析时,选取的样本不够随机或不够有代表性。举例来讲,互联网圈的人会发现身边的人几乎不用「今日头条」,为什么这 APP 还能有这么大浏览量?有个类似的概念,叫幸存者偏差。

    3、定义

    在看某些报告或者公开数据时,经常会有人鱼目混珠。「网站访问量过亿」,是指的访问用户数还是访问页面数?

    4、比率

    比率型或比例型的指标出现的谬误以至于可以单独拎出来将。一个是每次谈论此类型指标时,都需要明确分子和分母是什么。另一方面,在讨论变化的百分比时,需要注意到基数是多少。有些人即使工资只涨10% ,那也可能是150万…

    5、因果相关

    会误把相关当因果,忽略中介变量。比如,有人发现雪糕的销量和河溪溺死的儿童数量呈明显相关,就下令削减雪糕销量。其实可能只是因为这两者都是发生在天气炎热的夏天。天气炎热,购买雪糕的人就越多,而去河里游泳的人也显著增多。

    6.辛普森悖论

    简单来说,就是在两个相差较多的分组数据相加时,在分组比较中都占优势的一方,会在总评中反而是失势的一方。

    六、要点复习

    1.还记得“如果你不能衡量它,那么你就不能有效增长它”这句话吗?我们做数据分析是为了能以量化的方式来分析业务问题。其中有两个重点词语:量化和业务;

    2.数据本身并没有任何价值,而一切数据分析的核心是分析方法。数据分析的三大作用,主要是现状分析、原因分析和预测分析;

    3.数据分析的第一步就是建立指标体系,但是不是所有的指标都是好的,我们需要找到产品的“北极星”指标。除此之外,不同时期的北极星指标不一样,不同业务的北极星指标也不一样;

    4.数据分析大体可以分三类:利用维度分析数据、使用统计学知识如数据分布假设检验、使用机器学习;

    5.维度分析数据是一种自上而下的思路,这种思路多是用于产品的数据分析体系或者模型的建立,从而保证数据分析的全面性;使用统计学知识如数据分布假设检验是一种自下而上的思路,这种思路多用在针对已有数据报表中的数据问题发现。

    更多干货内容,欢迎关注公众号:数猎天下DataHunter

    DataHunter,让你爱(AI)上看数据

    相关文章

      网友评论

        本文标题:快速上手数据分析,你只需要这份框架...

        本文链接:https://www.haomeiwen.com/subject/lyjhrqtx.html