美文网首页大数据解决方案大数据开发
##[永洪科技]学了那么多工具之后,该如何做好数据分析?

##[永洪科技]学了那么多工具之后,该如何做好数据分析?

作者: 葡萄喃喃呓语 | 来源:发表于2016-12-01 15:05 被阅读31次

    专访 | 永洪科技王桐:学了那么多工具之后,该如何做好数据分析? - 简书 http://www.jianshu.com/p/57a27381549a

    数据分析的方法论是共通,并不受行业和领域的限制。这个方法论提炼出来以后,就可以应用在不同的行业和领域中去。

    很多数据分析师,不管是甲方还是乙方,总是一上来就罗列很多分析方法,但这些分析方法之间并没有什么逻辑,只是堆砌。列出的种种指标也存在这样的问题,拿出去给别人看,别人也看不懂,不知道这些指标到底在干什么,很零散。


    编者按
    前不久,CDA数据分析师公众号发布的一篇文章名为《为什么学了工具,还是做不好数据分析》(还没来得及看的同学请戳为什么学了那么多软件,还是做不好数据分析?)。
    这篇文章获得了很多关注,被许多人转发到了朋友圈,其中就包括永洪科技销售副总裁王桐(▔▽▔)/。于是,C君有幸约访了王桐,继续来聊一聊这个话题。
    在2014年加入永洪科技之前,王桐曾供职Oracle和IBM,担任过销售、咨询等方面的重要职务。他称自己经历了一个「非典型性」的成长过程。与「科班出身」的数据分析师相比,王桐也许不长于「术」,却喜欢思考「道」。此前与咨询相关的工作经历让他更善于总结,提炼出更具广泛适用性的数据分析方法论。看一看他的分享,也许会帮助你不被工具和技术所囿,从另一个层面来看待数据分析。
    以下为C君根据王桐访谈实录整理


    王桐 ****永洪科技销售副总裁
    以终为始 化繁为简
    加入永洪之后,有幸接触到来自各行各业的客户。我们帮助他们搭建大数据平台或者数据分析系统,这个时候我发现,他们问的下一个问题永远是:我该怎么用?怎么分析,或者分析些什么?
    当技术和产品相对比较成熟之后,下一步就要解决应用的问题。不同的行业和职能部门业务不一样,他们关心的数据也不一样,实际上他们做数据分析的方法论是共通,并不受行业和领域的限制。这个方法论提炼出来以后,就可以应用在不同的行业和领域中去。
    那么,数据分析的方法论都包括哪些?
    简单来讲,从个人的微观层面看,很多数据分析师,不管是甲方还是乙方,总是一上来就罗列很多分析方法,但这些分析方法之间并没有什么逻辑,只是堆砌。列出的种种指标也存在这样的问题,拿出去给别人看,别人也看不懂,不知道这些指标到底在干什么,很零散。
    就数据分析这件事情来讲,会问问题的那个人可能比学过统计的那个人更重要。史蒂芬·柯维(Stephen R.Covey)在谈高效人士的七个习惯中,第二个习惯是「以终为始」,我们一定要以结果和目的为导向,目标明确了,才知道后边该怎么做。
    比如说,我看到了一个数据,去年公司营收是8000万,现在让我来分析,那么我的提问路径是什么?首先,我看到这个数字,要去判断8000万是好还是不好。做判断就要进行对比,找参照物,你可以和自己对比,去年做8000万,前年是5000万,大前年2000万,趋势还不错;也可以和别人对比,你做800万,同行做5个亿,那就是有问题。从各个角度在时间轴上做对比,才能更好地做判断。
    有了初步的结论之后,就要找原因,所以第二步是归因。我认为,找原因就是一个不断细分的过程。比如去年营收8000万都是由哪些方面构成的?如果营收下降,是在哪一个部门、哪一个渠道、哪一个区域下降,要细分到可以对具体的人来问责。有些原因可以从数据上直接看到,有些则隐藏在数据背后,与具体的负责人沟通之后,才能找到真正的原因,做一些运营的策略来改进。
    从宏观上来看,企业构建一个数据分析体系,思路与此类似。首先确定企业的目标是什么,然后从此展开,寻找最直接影响核心目标的指标都有哪些,一层一层拆解下去,你会发现你最初堆砌的那些指标都会被包含进去,但不再是零散的,而是被一个有逻辑的网络连接起来。这种数据分析的逻辑捋顺之后,用什么工具其实并不重要。
    我们做咨询的时候总是喜欢把复杂的问题归类到很简单的模型中,再演绎出一些实用的方式和场景。其实数据分析也一样,无非是先判断再诊断,把对比和细分这两点抓好,那么你做数据分析的思路和逻辑就很清晰了。
    学会发问 提炼「套路」
    工具并非不重要。****在入行的最初两三年,数据分析师必须要成为一个熟练的工具使用者。其实从企业的角度讲,企业也并不指望一个刚入行的数据分析师独立完成项目,新人的价值就在于能熟练使用工具,能完成布置下来的任务。这个很重要,是基本功。两三年之后,你想登上更高的台阶,就要学会如何让数据对业务产生价值,学会提出问题
    解决具体分析问题的过程就是一个宝贵的学习过程。从大的概念上来说,人类学习的过程就是在模仿中不断提炼的过程。在具体的任务中,你可以思考,给你布置任务的那个人,他的提问路径是什么?他给你的可能是许多连续的任务,也会把一个任务拆解成许多任务,为什么?通过这种思考你能观察出来他的提问路径,不断地积累自己的感觉,总结出一个「套路」
    作为一个数据分析师,不管是在技术部门还是在业务部门,你做的事情要最终产生业务价值,才会让价值最大化,当熟练运用工具之后,尝试用数据去理解和指导业务,你就会发现工具就只是工具。
    我比较看重思维方式的训练。过去做咨询的一些思维训练对我现在很有帮助,包括学习的思维和解决问题的思维。咨询比较擅长总结解决问题的方法论,这个方面推荐大家可以看看麦肯锡的《金字塔原理》、大前研一的《思考的技术》
    我觉得,学习应该是一个勤于思考和善于运用资源的过程,学会提炼模式。我看到别人做好了一件事,我是否可以把他做事的套路提炼出来,用到自己身上。否则你只是看到他做好了一件事情而已。穷举,抽象,归纳,演绎,不管你是不是在做数据分析师,学会这些高效的做事方法,都会受益匪浅。
    最后插播小广告,我们欢迎大家加入永洪。如果你不确定这个行业是否有前景,你可以看先到永洪来看看,我们在金融、零售、银行、电信、制造、互联网都有涉及,与各种行业的标杆企业进行合作,会是一个不错的广度接触,多向发展,也可以朝着你感兴趣的某一个领域深度发展,在这里都会有不错的选择。
    大彩蛋:其实还有关于敏捷BI的一些探讨,收录在此,以飨读者
    与传统BI相比,敏捷BI最显著的优势在哪里?
    A:很多人都知道BI(商业智能),但是传统BI厂商提供的整套BI方案的往往让企业客户难以接受:一是,项目投入非常大,人力物力财力的投入都是非常大;第二,项目周期跨度长。随着带来项目风险和项目未知的因素也就越多;第三,传统BI厂商需要先调研再确立需求,然后再基于这些需求分层次进行数据的提前运算,包括复杂的表关系分析,建立等,项目初期对客户的要求非常高,可能需要各个部门所有人员都要纳入到项目体系里面。
    然而,企业当前面临的各种需求,使得他们对BI平台的要求也越来越高:
    敏捷化:政策、市场、业务经常变化,数据分析需求也经常变更,分析报表需要在当天内实现,及时支撑业务决策,而不是花几周的时间开发程序,贻误战机;
    高性能:交易数据、流量数据、用户数据数量庞大,需要实现秒级响应的分析处理;
    自服务:有分析需求的业务人员能够亲自进行分析的过程,而不是增加IT人员工作任务,释放数据的价值,人人都是数据分析师。
    而敏捷BI的特点恰好满足了当前企业的各项需求:
    第一,要简单交付、极致易用:打破传统BI软件建二次表、Cube、复杂模型的漫长流程,直接基于细节数据,通过人性化拖拽快速生成分析报表。
    第二,要能进行灵活的自服务操作:无需技术背景,业务人员可自服务完成分析需求;一天内实现新报表、一天内变更报表需求,保持分析思维的连续性;研发人员的负担骤然减轻。
    第三,要支持移动跨屏:无缝支持PC、iPhone、iPad和Android,并在这些终端设备上保持一致、易用的用户体验。您可以随时随地通过移动设备进行数据分析,从而做出正确决策。
    第四,要支持高性能计算:支持秒级计算,可单机部署,亦可基于PC服务器进行分布式扩展,利用列存储和内存计算,实现从千万到百亿级数据分析的秒级响应,支撑更多分析维度和更大的数据范围。
    以下图片供参考:

    永洪BI是按照这些标准研发的敏捷BI产品,可以在前端进行多维分析和报表展现的新一代敏捷型BI软件,上线周期快,操作简单,人人都能以自服务的方式来进行数据分析,满足对数据分析和展现的多变需求。
    国内BI市场发展到了什么样的阶段?未来的走向和趋势如何?
    A:在永洪科技创业前期,我们就看到传统BI和数据分析领域的一些问题。
    首先,传统数据分析平台无法适配云端。Gartner预测云端数据分析是未来的重要发展方向。这对数据分析平台提出了更高的要求,必须能够在云端部署,必须支持云端数据。 但是,传统BI厂商并没有为此做好准备。
    其次,传统数据分析不能很好地处理大数据。2013年的Forrester的调研报告显示,100家部署数据分析平台的企业,其中80%拒绝使用,只有20%在使用。80%企业不愿意使用的原因有两个:第一个是数据分析的环节多,周期长;第二个是分析结果只能是静态报告。
    我们通过调研发现,企业客户的IT瓶颈化严重。常常出现的现象是:业务部门提出的数据分析需求响应滞后,而IT中心的数据分析报告需求堆积如山。用一句话形容就是:IT部门忙得要死,业务部门急得要死。
    传统数据分析平台的产品碎片化严重。我们调研之后发现,企业客户做静态报告用的是一种产品,做探索式分析用的是另外一种产品,做大数据分析的产品就更多了Hadoop、Spark等,深度分析用R或Weka,这一系列的数据分析产品种类就超过了10种。在这种复杂的环境下,企业客户经常要纠结在不同产品见的数据对接,很难顺畅地完成一次真正的大数据分析。
    目前,我谈谈对国内外BI市场发展的两点看法:
    1.IT驱动转变为业务驱动。购买决策权正持续地从IT部门转换到各条业务线,因为他们需要面向业务人员的平台,而不仅仅是面向IT人员的平台。
    2.敏捷BI占据主流。传统BI巨头逐渐显露颓势,我们惊讶地发现在Gartner 2016魔力象限报告中几乎所有的传统BI巨头都被驱逐出了领导象限,而敏捷BI厂商占据了主流市场。
    敏捷BI适用于哪些领域的企业和应用场景?为什么?
    A:越是数据较多的地方,对数据分析的需求也就越旺盛,越是需要靠数据来说话的地方,越是更注重数字运营的企业。例如:金融、电信、互联网、电商、制造、零售、能源、医疗等以及政府机构。
    很多人有疑问,敏捷BI的深度用户是不是只有大数据量的企业?其实不然。我们在实际项目中发现,敏捷BI一方面适用于,政府、金融、电信、互联网、医疗、能源、零售快消、大型制造业/传统企业等这类数据量比较大的客户,也同样能够更好地适配于数据量比较小的中小企业,大型企业中有独立信息系统的业务部门。它的客户没有大小之分,具有很强的适应性。
    从用户分类情况来看,主要有四类用户群:第一类用户是报表的开发者,需求是快速开发;第二类是高级用户,大部分是数据分析专员或者业务专家。需求是深入洞察分析;第三类是普通用户,部分是经理,团队管理人员,需求是轻松上手及真正接触数据;第四类用户是高层管理人员,需要报表一目了然,便于操作,需求是随时随地查看数据,提供决策支持。
    为什么,今天的敏捷BI成为主流?其实这样的意识是不断的在演变,就像当年我们的PC市场一样,90年代初PC是非常珍稀的设备。如果要用PC,过程很繁琐,而且主要是IT部门在用。到现在不仅仅PC是我们每一个人的标配,连手机的计算能力都已经变得非常强大。每个人的手机上面少的几十个,多的可能是几百个应用。
    但是,几年前的BI与分析市场像当年90年代要换鞋进机房去使用数据分析一样。比如,我们做数据分析的时候,要去做数据准备、ETL、数据治理,还要打英文,还需要动态空间,而动态空间又需要IT部门来协助,过程繁琐,不利于快速有效地回答问题。
    BI与分析市场的另外一个窘迫是静态报告,不能进行持续的数据洞察,使得IT部门吃力不讨好:因为提出需求,提问与找答案的不是同一个人,所以会不断地出现问题。这不合理,所以这个瓶颈就要被砸掉。解决之道就是把BI与分析能力给企业里的每一个人,让业务员自己来提问,自己找答案,以此类推。
    DT时代,每一个业务人员会问很多问题,而且这些问题不是一蹴而就的,需要被迭代、优化,需要把一个问题分解成十个问题,最终才能找出第一个问题的真正答案。所以,BI与分析能力应该像90年代的PC一样,它应该给企业里面的每个人赋予一种提升工作效率的能力,就像手机一样,给每人一台智能手机,让大家可以基于自己的BI与分析平台去使用数据、去消费数据,去发现洞察,去改进业务。
    随着敏捷BI的普及,它将会给企业带来什么影响?
    A:敏捷BI的普及一定会带来社会和企业带来巨大影响。它会让企业的每个人都能够根据自己的需求做数据分析,每个人都能用好数据,甚至每个人都是一个分析师,都能基于一个开放的环境去提问,例如,销售情况、市场获客情况、生产制造情况等这些开放的问题。这种普及的应用,最终会帮助企业去构建未来十年的竞争力。所以企业里面的每一个人,都要认真思考,能不能帮助企业构建基于敏捷BI的分析平台,把分析的能力赋予企业的每个人,像当年的PC,现在的手机一样,让每一个人都可以把计算和应用的能力触手可及,帮助他们改进,持续优化业务。
    不过,单靠任何一种敏捷BI工具也是很难实现这么巨大价值的。因此,我们提出来了一站式大数据分析平台,它包含了业务人员需要使用的几乎所有的功能模块,其中服务包括数据准备、探索式分析、深度分析,以及IT中心需要一起进行有力的企业级管控等,帮忙企业构建自己的洞察力和增强核心竞争力。
    文/CDA数据分析师(简书作者)原文链接:http://www.jianshu.com/p/57a27381549a著作权归作者所有,转载请联系作者获得授权,并标注“简书作者”。

    相关文章

      网友评论

        本文标题:##[永洪科技]学了那么多工具之后,该如何做好数据分析?

        本文链接:https://www.haomeiwen.com/subject/wfixmttx.html