大数据从几年前的概念到现在落地数据,越来越多的人感受的数据的价值,目前全国各大高校同样陆续开设数据科学与大数据专业,企业也已开展招聘数据分析相关的职位。
之前想成为数据分析师的人大致有三类:
第一类是非计算机专业的在校生,不知道怎么回事,反正就是对数据感兴趣了,然后想毕业之后从事相关工作,但对职位要求、该做什么准备一无所知,处于懵懂期;
第二类是互联网公司的产品经理和运营经理,及少数的市场经理。这些人在实际工作中,发现确实数据很有用,但对自己的数据分析能力感到不满意,进而想做出提升;
第三类是传统企业的业务人员,也是不知道怎么就对数据感兴趣了,想要从事数据分析相关的岗位,但缺少时间系统学习,工作经历又不足以支撑自己跳到数据分析职位。
而现如今随着互联网大数据应用的广泛展开,越来越多的企业、政府机构等开始设立数据相关的角色以及职责。
围绕数据分析工作,也划分了几类职责区域。从平台建设线上,包括:
数据平台工程师:负责数据平台的研发,牵涉到从数据采集到分析的相关组件开发。
数据挖掘工程师:利用机器学习/数据挖掘相关技术,研发算法模型,用于个性化推荐、用户画像、精准广告等。
数据产品经理:把数据相关的需求抽象为数据平台的功能产品。
从数据流向的角度,包括:
ETL 工程师:把工程团队的模块产生的数据,不管是日志、数据表,还是埋点的数据,进行清洗、转换,建模成利于数据分析的数据。ETL 是 Extract – Transform – Load 的缩写。
数据分析师:利用 ETL 工程师处理好的数据,满足业务人员的数据需求。
业务人员:产品、运营、市场、管理层等,因为产品改进、运营活动、商业决策等,有数据需求。
数据分析师的基本要求
对数据感兴趣:是不是看到一行行的数字就头大,选择直接跳过?还是愿意花些时间研究这些数字背后意味着什么?如果你看苹果的发布会的话,会看到乔布斯的幻灯片里出现最多的就是数字,卖了多少部,分了多少钱,厚度减少到多少毫米之类的,他相信数字简单明了。
如果对数据不感兴趣,这个角色一定不适合你。
良好的理解和抽象能力:把业务人员说的只言片语,抽象为明确的数据需求,清楚怎么从基础数据中实现出来。还有把一些重复性的需求,抽象出模式来,用机器来替代。
良好的表达能力:数据分析师有个天然的优势,能够直接和老板打交道,这就要求你能站在老板的层面来表达。把一堆堆的数据,很好的呈现给业务人员,帮助他们做出正确的决策。
快速动手能力:业务人员提的数据需求,巴不得下一秒都拿到。
数据分析的专业能力兴趣是可以培养的,既然愿意看这篇文章,说明有兴趣。理解、表达、动手能力,是要有意识的训练。数据分析的专业能力,是可以通过学习提升的。
作为数据分析师,无论最初的职业定位方向是技术还是业务,最终发到一定阶段后都会承担数据管理的角色。因此,一个具有较高层次的数据分析师需要具备完整的知识结构。
1. 数据采集
了解数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条件、格式、内容、长度、限制条件等。这会帮助数据分析师更有针对性的控制数据生产和采集过程,避免由于违反数据采集规则导致的数据问题;同时,对数据采集逻辑的认识增加了数据分析师对数据的理解程度,尤其是数据中的异常变化。
2.数据存储
无论数据存储于云端还是本地,数据的存储不只是我们看到的数据库那么简单。
3.数据提取
数据提取是将数据取出的过程,数据提取的核心环节是从哪取、何时取、如何取。
o 从哪取,数据来源——不同的数据源得到的数据结果未必一致。
o 何时取,提取时间——不同时间取出来的数据结果未必一致。
o 如何取,提取规则——不同提取规则下的数据结果很难一致。
4.数据挖掘
数据挖掘是面对海量数据时进行数据价值提炼的关键,以下是算法选择的基本原则:
o 没有最好的算法,只有最适合的算法,算法选择的原则是兼具准确性、可操作性、可理解性、可应用性。
o 没有一种算法能解决所有问题,但精通一门算法可以解决很多问题。
o 挖掘算法最难的是算法调优,同一种算法在不同场景下的参数设定相同,实践是获得调优经验的重要途径。
5.数据分析
数据分析相对于数据挖掘更多的是偏向业务应用和解读,当数据挖掘算法得出结论后,如何解释算法在结果、可信度、显著程度等方面对于业务的实际意义,如何将挖掘结果反馈到业务操作过程中便于业务理解和实施是关键。
6.数据展现
数据展现即数据可视化的部分,数据分析师如何把数据观点展示给业务的过程。数据展现除遵循各公司统一规范原则外,具体形式还要根据实际需求和场景而定。
7.数据应用
数据应用是数据具有落地价值的直接体现,这个过程需要数据分析师具备数据沟通能力、业务推动能力和项目工作能力。
数据沟通能力。深入浅出的数据报告、言简意赅的数据结论更利于业务理解和接受,打比方、举例子都是非常实用的技巧。
网友评论