• 剧情前奏:
本人与2008年毕业于一个理工科大学的专科学历,学习的电子技术相关的专业。偶然的机缘进入了一家世界500强外资企业的电子工厂,从此过上了上班打卡下班睡觉的操作工人。但是不信命的我一直在不停的折腾,一会儿学 C/C++,JAVA,HTML,SQL,Excel,PPT,甚至PS...
结果一事无成。
• 初识数据
2011年的时候通过内部转岗到了产品工程部,做质量控制的技术员(俗称QA)。于是开始接触数据相关工作,做的最多的还是Excel.第一次接触vlookup是因为两个批次的产品mixing,于是从上一个操作站点提取数据与当前站点的对比。然后接触到了一些函数,再接触数据透视表!
与此同时,因为要提取测试数据,所以接触到了SQL。刚开始的时候都是别人已经写好了得脚本在PL/SQL里面运行就能拿到结果了!再导入到Excel进行分析处理,比如计算出良率,共性分析…… 首先从select * from xxx_table 开始,然后加入where, 然后再来选择列等等!
接下来直接去到测试记录的文档里面探索,纯文本的记录。虽然记录还是有规律的,但是数据量太大了,动不动就是百兆开始的。想要快速的找到自己需要的数据,所以必须要有自己的方法!所以对于notepad++,Textpad8,Beyond compare...开始了深入的研究。
接下来开始学习了Python,想学习怎么爬去网络数据。直接从公司的一个网站入手,结果卡壳半年都没下登录的了网站。后来使用Requests登录网站后,发先了另外一个坑,这是个动态网站。于是转战selenium,终于实现数据提取。然后pandas,matplotlib...
• 接下来的路
更深入的进入到数据分析这个领域,利用学习到的知识来提升自己业务方面的统筹分析,进而得到职业升迁!
• 数据在哪里?
1. 公司内部有非常庞大的数据库,以及文本数据,对业务方面有改进或者提高的分析都会促进个人职业发展
2. 网络数据,使用爬虫抓取数据,免费分享的数据,竞赛数据。
https://www.theguardian.com/sport/datablog/2012/jun/25/olympic-medal-winner-list-data#data
Olympic medal winners: every one since 1896 as open data,保存于google document 里面。可以前往下载!
本数据来源于奥林匹克1986-2008的比赛获奖数据。包含了10个字段,城市,那一届,运动类型,比赛项目,运动员名字,国家,性别,运动项目,男/女/混,奖牌。
• How to do?
1. 2018-11-29正式开始
2. 学习课程每两周>10小时
3. 继续学习http://Lynda.com上的数据分析课程
4. 将学习内容记录到文章里面,从#0001#开始
使用一个Excel table 记录学习时间,每月底复盘分析!
网友评论