前言
2019年毕业大军达到900万人,校招,春招是国内,国外,应届生的战场,随着就业形势一年比一年严峻, 越来越多的岗位对应聘者提出了多元化需求,其中被众多求职者诟病的即是“数据分析岗位”,在如今在大数据时代,凡是和数据沾一点边的人都想应聘这个岗位,它不下雨算法,机器学习岗位的聪明的大脑,但也是分析岗位,这也造成了这个岗位在不同公司需求也不同,并且随着算法的普及,机器学习也成为了数据分析岗位的求职点。
言归正传,本科双非,硕士中等985,生化环材专业,有点工程方向,但是学什么都是根据导师的项目走,没有明确的技术路线,近些年医疗大数据火的不行,使用过几个机器学习算法处理过一些电子病案,项目水的不行,其他时间全在申报项目,吐血。硕士期间没有实习,只有本科一段数据分析实习,还是做Excel数据分析,研究生主要是有一个医疗数据挖掘项目, 和很多人比,真的是简历都拿不出手。
当时想的是最起码做过数据挖掘,也是大言不惭,想着找数据挖掘,算法工程师,春招试水的时候有幸拿到某小厂的信号处理offer,可惜不让实习,那段时间天天在牛客上刷要不要去实习,最后还是怂,没去保毕业。春招的时候就已经看到算法已经是神仙打架,大家肯定知道算法转的比较多的就是开发和数据分析,开发自己确实不感兴趣,对于数据很感兴趣,而且自己要paper没有,要技术不行,因此果断考虑转数据分析岗位。(这里提醒大家一定要有侧重吖,有时间的话两个都可以准备,没有时间的话最好有侧重,我当时就是芝麻西瓜都想抓,结果发现自己上不成下不就。。)
5月准备
差不多春招结束就已经5月底了,这个时间就已经在准备数据分析了,看了很多方面的博客和书籍,主要有3个维度如下
1)数据分析工具(Excel+SQL +python+R,数据仓库)

1. 工具
常用的数据分析工具有Excel+SQL+Python/R,有的公司要求会一种就可以,有的要求都会,所以根据你应聘职位的不同自由选择学习就可以。
1)Excel
需要掌握的核心技能有:常用函数的使用,基础图表的制作,数据透视表,vlookup
2)SQL公司的内部数据存储在数据库中,作为数据分析师要能够从数据库中获取数据并进行分析。需要掌握的核心技能有:
会利用SQL操作开源数据库mysql进行增加、删除、查询、修改
存储过程数据库的分组、聚合、排序最常见的考SQL的方法给你一个虚拟的数据库表结构,然后让你按给出的条件查询出数据,并用手写的形式写出在纸上。所以面试前把常用的语句记清楚就行了。可以买一本《SQL必知必会》放在手边,随时翻看。
此外现在多数都以Hadoop 或者hive要求
3)编程语言Python或者R
一般情况下,这两种语言会一种就够了。如果是学习Python的话,需要掌握的核心技能:
Python基本语法、基本数据类型、常用的数据结构、条件和循环、函数、模块
Python数据分析的包(numpy, pandas, matplotlib)
能够用python操作结构化数据,进行数据清洗,数据抽取,数据可视化等,把对应的平时一些数据处理和模型构建的代码背熟final apply
使用python操作数据库
一般不会在代码上问得太细,毕竟写工作的时候不会的就用搜索引擎搜呗,面试官重要的想知道你究竟有没有用过这个技能。可能会手写代码
2)理论知识(概率统计+ML)
1)统计概率
这是数据分析必须要学的,不然很多统计指标看不懂,统计方法也不了解,怎么做数据分析呢?
需要掌握的核心技能有:
描述性统计(平均值,标准差,中位数,变异系数,)
概率(独立事件,相关事件,期望,包括贝叶斯)
概率分布(离散概率分布,连续概率分布)
统计推断(抽样,置信区间,假设检验)
例如面试官可能会这样问:置信区间 (Confidence Interval) 是更怕I型错误还是II型错误?更怕I型错误,这两个是矛盾的存在,一般a越小,I型错误出现概率越大
设置ab testd的时候需要注意什么?某一天的车流量更像哪种数据分布等
2)机器学习(加分项)
机器学习这一块其实应该算是数据分析岗位的加分项,不一定是必须的,要看具体岗位。
需要掌握的机器学习算法:
分类算法:逻辑回归,贝叶斯、决策树、随机森林
回归算法:线性回归
聚类算法:K-means
需要掌握的核心技能:
特征工程
模型评价
交叉检验(用已有的数据监测算法的预测力)
能够熟悉常见算法的基本原理、了解各类算法的优缺点和使用场景即可,如果是学到Python,要会使用Python的机器学习sklearn包应用这些算法解决具体的问题。这方面多做几个kaggle项目可以解决:Kaggle如何入门?
3)业务逻辑(数据分析思路-搭建数据指标体系)
数据分析师每天要关注大量数据指标,而数据指标又与具体的领域业务相关,掌握常用的数据指标可以灵活应对面试中提出的业务问题。
比如面对新的数据需求,能否将它拆分成具体的指标进行计算? 各个指标如何衡量,比如app的转换率,是点击算转化还是注册了算转化还是购买产品后算转化?
需要掌握的核心技能:
某一领域的知识概要(只需要大致了解)
数据分析思维:漏斗思维,分类思维,平衡思维,A/B test等
相关性和因果关系的区别,
通过案例可以分析出来
如何习得这方面能力呢?
掌握常用的数据分析指标体系,可以看《增长黑客》《增长黑客实战》。这个话题比较长,我后面会专门写一篇文章聊聊具体数据的分类,常用的指标体系,以及如何通过一个项目来熟练应用并向面试官展示你有这方面能力。---
2)如何做数据分析报告?
数据分析的最终产出是一份份报告,可能是PPT,也可能是PDF等,或者使用python的notebook来生成。
上面每个技能的熟练程度划分为5个等级,依次分别是:
了解基本概念
了解基本概念/会简单操作
熟悉基本概念/熟练操作
精通逻辑论证/能改进优化
对于找数据分析师实习或者初级数据分析师的工作来说,上面这几个知识大多只需要掌握到第2个等级就可以了。
网友评论