先举两个例子吧,分别是我和朋友Eric的分析师之路。
Eric码农转行,虽半路出家,但如今管得了数仓,写得了模型,还能独立设计数据标准和模型管理流程,业务水平仅次于部门leader;我呢,统计学出身,经历了几次跳槽转行之后,才最终走上数据分析师之路。
这两个例子我想说明什么?首先,数据分析师入门不难,其次,你需要明确自己的需求。在走数据这条路之前,如果你对数据分析有所了解,试问自己是更适合做偏技术的,从数据建模、数据挖掘算法;还是偏向和业务打交道,重点用数据推进业务的角色。前者未来会成为数据科学家,后者更多会走向运营、战略管理岗。
但在初期起步和成长阶段,该掌握的基础还是要掌握的。
数据分析起步
非常简单,就是——多接触数据!
然后呢?
没了!
Eric说他自己是从记数据开始的。
记数据一方面是为了应付领导的提问,另一方面也是在培养数据的敏感度。确实,分析的源头一般是某些指标有了明显的变动,熟悉每天的交易数据或用户数据能让你一眼就看出问题在哪里,哪些数据有关联,然后再做分析。
我刚开始大部分时间都在取数,做报表,还要和业务扯皮。久而久之也就理解了数据背后的业务含义,指标意义。
万事开头难,但一旦数据分析有了动力,就要开始完善自己的知识体系,这也是真正入门的开端。
完善数据分析的知识体系
接下来就需要一步步迈入门路中,首先,你得掌握基本的计算机知识和统计学知识,同时,也要熟悉公司的业务,明确自己的现有水平,并朝目标迈进。
1、基本的计算机知识和统计学知识
数据库+SQL语言
一些常用的数据库如Oracle、SQL Sever、DB2、MySQL,这些数据库或者说日常接触的数据库都要有所了解,懂最常用的就好,最重要的还是要会写SQL。
数学/统计学知识
一些基本的数学统计方法如描述性统计、多元统计分析、回归分析等,重要性不言而喻。方差分析、回归分析、因子分析、聚类分析等等,这些作为入门多多少少都要会一些,虽然有可能不会全用到,但一旦用时方恨少。
数据分析+可视工具
数据分析可视化工具很宽泛。首推Excel,中小公司很依赖,熟练使用数据透视表,这是必备技能。中大型公司可能用报表工具或者BI来做报表,但有了SQL+Excel的基础,这些工具上手都很快。python/R技能也要学习,俗话说“技多不压身!”,构建模型很需要,虽然基础数据工作大多不需要,但后期构建模型离不了,求职时掌握一门很加分。
2、熟悉业务知识
数据分析师要与公司的各业务打交道,所以清晰掌握业务内容指标等在工作时会让你得心应手。
如,你可能需要知道这个指标由哪些数据构成?数据统计的口径是什么?数据怎么取出来?这个指标对于行业的意义是什么,处于什么范围分别对应什么样的情况,是好还是坏,然后慢慢摸索这个指标层面多维度的规律,如何设定最合理等。
基础的计算机知识和统计知识以及业务知识,帮助你建立起完善的知识体系。在熟悉了本领域的内容后,做进一步的深入就会容易得多。
做进一步提升
要想进一步提升,自我的认知很重要。
先明确自己的位置,设立合理合适的目标,再一步步走过去。
附上网上的一张数据分析师能力体系图,用于参考:
对于自己的水平认知,可以借助知乎上@任明远的自问问题:
1、你了解你所整理的数据的来源吗?是自己公司的业务数据,还是与合作伙伴交换的数据?是自己公司相关部门采集的,还是从第三方获取的?获取过程中,具体的指标和逻辑是什么?
2、这些数据是真实的吗?采集和整理过程中会不会出现什么问题?技术上的逻辑和业务上的逻辑是不同的概念,有没有技术上没有瑕疵,但并不符合业务逻辑的数据流程?
3、到你手里的数据经过了什么处理?你又做了什么处理?为什么他们和你要做这些处理?
4、谁需要你的数据?你处理后的数据流向哪里?他们用数据做什么?这些数据最终又拿去做了什么?比如,为客户做了什么服务,公司发布了什么内容,或向管理层证明了什么KPI,或支持了哪个部门的评估?
5、你做整理的周期是什么?为什么是这样的周期?
6、公司有其他的部门在处理其他的数据吗?是什么样的数据?和你有什么关系?为什么这些数据要分开处理?
7、近一年,你自己的电脑上应该已经积累了不少数据,试试做个分析,从一段较长的时间来看,你负责的这一块数据发生了什么变化?为什么会有这个变化?和公司的产品、经营、业务有关,还是和行业有关?具体怎么有关?
在对自己有了清晰的认识后,以下从三个方面给大家一些小tips:
业务
1.业务为核心,数据为王
了解整个产业链的结构
制定好业务的发展规划
了解衡量的核心指标
有了数据必须和业务结合才有效果。所以这个阶段必须要对数据敏感,要在工作中不断积累培养数据驱动业务的意识,简而言之就是用数据指导业务,帮助业务发展壮大。
所以需要懂业务的整体概况,摸清楚所在产业链的整个结构,对行业的上游和下游的经营情况有大致的了解。然后根据业务当前的需要,指定发展计划,从而归类出需要整理的数据。最后一步详细的列出数据核心指标(KPI),并且对几个核心指标进行更细致的拆解,当然具体结合你的业务属性来处理,找出那些对指标影响幅度较大的影响因子。前期资料的收集以及业务现况的全面掌握非常关键。
2.思考指标现状,发现多维规律
熟悉产品框架,全面定义每个指标的运营现状对比同行业指标,挖掘隐藏的提升空间
拆解关键指标,合理设置运营方法来观察效果
对核心用户,单独进行产品用研与需求挖掘
业务的分析大多是定性的,需要培养一种客观的感觉意识。定性的分析则需要借助技术、工具、机器。而感觉的培养,由于每个人的思维、感知都不同,只能把控大体的方向,很多数据元素之间的关系还是需要通过数据可视化技术来实现。
3.规律验证,经验总结
发现了规律之后不能立刻上线,需要在测试机上对模型进行验证。
技能
1. Excel需要更精钻
除了常用的Excel函数(sum、average、if、countifs、sumifs、offset、match、index等)之外,Excel图表(饼图、线图、柱形图、雷达图等)和简单分析技能也是经常用的,可以帮助你快速分析业务走势和异常情况;另外,Excel里面的函数结合透视表以及VBA功能是完善报表开发的利器,让你一键轻松搞定报表。
2.你需要更懂数据库
常用的数据库如MySQL,Sql Server、Oracle、DB2、MongoDB等;除去SQL语句的熟练使用,对于数据库的存储读取过程也要熟练掌握。在对于大数据量处理时,如何想办法加快程序的运行速度、减少网络流量、提高数据库的安全性是非常有必要的。
3.掌握数据整理、可视化和报表制作
数据整理,是将原始数据转换成方便实用的格式,有时候Excel在协同工作并不见得是好工具,专业的报表工具效率更高。常规的取数、可视化也可以借助Tableau、FineBI、Qlikview等BI工具,这些便捷的工具都能淡化数据分析时一些重复性操作,把精力更多留于分析。
4.数据挖掘
Python/Java/C++至少得熟悉一门,Shell得会用……总之编程语言绝对是数据挖掘工程师的最核心能力了。
思维
前面提到的都是硬技能,如果说数据分析师必不可少的一项软技能,当属逻辑思维能力,这一定是会考察的。
对于初级数据分析师,逻辑思维主要体现在数据分析过程中每一步都有目的性,知道自己需要用什么样的手段,达到什么样的目标。
对于高级数据分析师,逻辑思维主要体现在搭建完整有效的分析框架,了解分析对象之间的关联关系,清楚每一个指标变化的前因后果,会给业务带来的影响。
对于数据挖掘工程师,逻辑思维除了体现在和业务相关的分析工作上,还包括算法逻辑,程序逻辑等,所以对逻辑思维的要求也是最高的。
这里推荐几本书《金字塔》《学会提问》《麦肯锡系列》《博弈论》给大家,希望能帮助大家锻炼思维。
数据分析师是一个综合且需要不断吸收新知识的职业,它既可以包罗万象,也可以被做到炉火纯青。根据自己的需求和目标,不断摸索适合自己的方法,同时与时俱进,方能成为时代的“弄潮儿”。
分享更多干货,和我一起探讨数据分析,可以添加我的公号。
共同进步,多多指教!
网友评论