文字2524,预计8分钟
转行之路的萌芽
迷茫期,某985学校的化工专业的研究生,毕业时与大多数那会的工科生一样,其实不知道自己想要做什么,除了研发之外,就只能选择工科生都可以去的制造业,选择一家500强,做一名生产运营的管培生。
在工厂轮完一年的岗,觉得依旧是迷茫,不知道以后要做什么。在工厂里,觉得有种与外面隔绝的感觉,生活也很安逸,可以准点上下班,但是想追求更好的我,找不到成就感。
转折期,由于自己的作为一名生产工程师,需要用到很多产线上的设备数据进行效率分析,发现自己对于这块比较感兴趣,可以通过数据输出一些洞察,进一步指导生产中的改善。还有一次意外的机会,集团网站上使用POWER BI做的可视化图表来展示制造的绩效水平的dashboard,让我感动非常震撼。然后自己利用业务时间自学了这款软件,在工作中实践,根据逻辑建立数据模型来实现生产中异常的可视化。
火花点,随着新闻媒体中提到大数据,人工智能,物联网(ABC)等频率越来越高,以前封闭在工厂中的我开始慢慢关注外面悄然在发生的数字时代的大趋势。马云老师曾说过“未来的时代是数据时代DT“。麦肯锡的在2011年一篇咨询报告MGI_big_data_full_report中透露到未来大数据领域的几大结合行业结合点以及数据分析人才需求的增加,让我对于这一领域未来倍感期待。读完了吴军老师《智能时代》,徐子沛的《大数据》,在读这些书的过程中,也更加坚定的自己转行之路。
所以我在16年07月初就下定决心要转行,把目标投向数据量巨大且人才需求量也最多的互联网行业。期望在11月份完成offer获取。
怎么去跨专业跨行业的转行?
因为周边并没有这样的朋友可以请教,我只能求助于互联网。在知乎上找了一些成功转行的帖子总结下经验,另外在招聘网站上汇总常见的数据分析师招聘需要的JD条件。明确了自己最大的差距是两个,一个是在于一些常见数据分析工具需要补齐,第二是互联网常见分析场景的业务思维,也称套路。
由于白天工作,只能晚上和周末抽时间来学习相关知识,虽然比较辛苦,但是每天都有收获的感觉是很幸福的。学习的地方选择了公司附近的学校图书馆,氛围好效率很高。
下面主要分享3个月的准备历程。
第一阶段是2周拿下数据分析师的基础必备技能-SQL。结合现在工作后反过来看的话,SQL真的很必备,数据分析工作汇总使用频率最高的非SQL莫属。花了1周时间入门了基础的SQL语句,看的是一个日本人写的入门教材《SQL基础教程(mick第二版)》,彩色的,有对应不同类型SQL语句的差异,主要看第一章到第7章。我用的互联网公司常用的开源MySQL。然后再花1周时间练习经典的在线SQL练习,熟悉基本的语法操作,然后自己又根据一个实战的大的case花了一周时间把它练习做完,SQL的基本语法语句比较简单,重点练习熟悉关联和条件的用法。在线练习链接如下:http://sqlzoo.net/wiki/SELECT_basics。
第二阶段是花了1个月补齐统计学的知识。统计学还是蛮重要的。推荐一本经典的书籍。安德森的《商务与经济统计-11版》。这本书特色是通过实际中的案例引入知识点,然后课后习题也都是实际的case,不会像普通教科书一样枯燥。这本书知识点比较多,入门比较重要的是第一章到第13章,其中第一章到第6章(基础的描述统计和概率相关基础知识),第7章-9章(关于区间和假设检验),第10章-第13章(假设检验和区间的应用于统计推断);后面有时间的话再过第14章-16章 + 18章+22章(模型篇:回归模型 + 时间序列模型+决策树)。每节课后习题一定要在学习知识点的时候,挑一些做。
第三阶段是1个月网红数据分析语言-python。虽然现在网上各种python学习的视频和培训班广告满天飞,我自己的亲身经历告诉你,作为入门数据分析师行业,它是非必备选择,招聘中也写了会是一种加分选项。当时自己也误以为是一定要会这个才投简历,花了大量时间来学习。其实如果追求快速进入这个行业,这个一部分可做简单了解。待入行后,可以慢慢学习。
python的优势有2点:一是大批量的做数据清洗和整理,尤其是非结构化数据,结构化的绝大部分场景SQL可以替代;二是建模类或者算法类时,必备的。
有的人可能会纠结是python还是R语言,我觉得因人而已,难易程度相似,根据自己的喜好来决定。
我自己学习走了点弯路,我先花了半个月时间看了廖雪峰老师的python入门帖子。再花了半个月看了一遍《利用python进行数据分析》,英文版有第2版了,重点章节是pandas,数据清理规整化,绘图和聚合运算。发现回味起来,竟然不知道学了什么。后来我网上报了一个课程,学习了数据清洗和整理,做了几个项目后,对python的掌握才有所加深。回过头看最有效的学习方式就是在项目中实践:在实践过程中发现不会的知识,对应章节去学习知识,然后不断的趟坑和成长。廖老师帖子地址如下:https://www.liaoxuefeng.com/wiki/1016959663602400。
第四阶段2周相关行业知识和分析套路的储备。这个时候硬件部分已经准备的差不多了,首先是要了解一些分析的方法论和框架。方法论可以参见麦肯锡经典著作《金字塔原理》,学习逻辑的思考和解决问题。关于数据分析流程和框架可以参考这本入门书《谁说菜鸟不会数据分析》。了解一些互联网的相关细分领域的常见分析思路,可以学习《精益数据分析》和《数据化管理》,我在面试中还用到了书中的case帮助。
因为我投的互联网行业,在百度上科普了跟UV,PV,转化漏斗,GMV,转化率以及埋点等相关知识点。另外互联网行业知识可以根据自己所投的细分行业,做一些相关的行业研究,为面试打一定的基础。
加餐项:关于可视化的软件
在实际的分析过程中,用SQL可以整理出维度表出来,然后用可视化直接访问SQL或者Excel表,然后可以对数据进行很便捷的多维度探索,我在实际工作中也是屡试不爽的。而且现在JD中也有描述类似可视化软件的也是加分项。
可视化软件中有两个神级软件:微软的POWER BI和Tableau, 选择困难症又来了。用一个形象的比喻是POWER BI安卓,Tableau是苹果。各有千秋,然后POWER BI是背靠着微软,整体来说是从Excel中升级出来的,而且最大的好处是免费;而Tableau是收费的,但是制图精良,白富美。
我用的是POWER BI,墙裂推荐马世权老师的《从Excel到POWER BI》,与一般的工具书不一样,POWER BI的主要功能和作用讲的如故事一样,当然工具还是得靠实践才能熟练起来。
经过1个月的面试,最终拿了饿了么和携程的数据分析师offer,虽然面试过程中有波折,但是最终结局还算圆满。
大礼包:关于文中提到的一些书籍电子版,我放在百度网盘上分享给大家,只需要关注微信公众号“数据氧气”,回复"数据分析礼包"即可获得提取码。
https://pan.baidu.com/s/1p6Nmyf1ptcbn6wYGgLpUQQ
网友评论