美文网首页
#0001#我是如何与数据作朋友的

#0001#我是如何与数据作朋友的

作者: 叁咪 | 来源:发表于2018-11-29 16:47 被阅读0次

    • 剧情前奏:

    本人与2008年毕业于一个理工科大学的专科学历,学习的电子技术相关的专业。偶然的机缘进入了一家世界500强外资企业的电子工厂,从此过上了上班打卡下班睡觉的操作工人。但是不信命的我一直在不停的折腾,一会儿学 C/C++,JAVA,HTML,SQL,Excel,PPT,甚至PS...

    结果一事无成。

    • 初识数据

    2011年的时候通过内部转岗到了产品工程部,做质量控制的技术员(俗称QA)。于是开始接触数据相关工作,做的最多的还是Excel.第一次接触vlookup是因为两个批次的产品mixing,于是从上一个操作站点提取数据与当前站点的对比。然后接触到了一些函数,再接触数据透视表!

    与此同时,因为要提取测试数据,所以接触到了SQL。刚开始的时候都是别人已经写好了得脚本在PL/SQL里面运行就能拿到结果了!再导入到Excel进行分析处理,比如计算出良率,共性分析…… 首先从select * from xxx_table 开始,然后加入where, 然后再来选择列等等!

    接下来直接去到测试记录的文档里面探索,纯文本的记录。虽然记录还是有规律的,但是数据量太大了,动不动就是百兆开始的。想要快速的找到自己需要的数据,所以必须要有自己的方法!所以对于notepad++,Textpad8,Beyond compare...开始了深入的研究。

    接下来开始学习了Python,想学习怎么爬去网络数据。直接从公司的一个网站入手,结果卡壳半年都没下登录的了网站。后来使用Requests登录网站后,发先了另外一个坑,这是个动态网站。于是转战selenium,终于实现数据提取。然后pandas,matplotlib...

    • 接下来的路

    更深入的进入到数据分析这个领域,利用学习到的知识来提升自己业务方面的统筹分析,进而得到职业升迁!

    • 数据在哪里?

    1. 公司内部有非常庞大的数据库,以及文本数据,对业务方面有改进或者提高的分析都会促进个人职业发展

    2. 网络数据,使用爬虫抓取数据,免费分享的数据,竞赛数据。

    https://www.theguardian.com/sport/datablog/2012/jun/25/olympic-medal-winner-list-data#data

    Olympic medal winners: every one since 1896 as open data,保存于google document 里面。可以前往下载!

    本数据来源于奥林匹克1986-2008的比赛获奖数据。包含了10个字段,城市,那一届,运动类型,比赛项目,运动员名字,国家,性别,运动项目,男/女/混,奖牌。

    • How to do?

    1. 2018-11-29正式开始

    2. 学习课程每两周>10小时

    3. 继续学习http://Lynda.com上的数据分析课程

    4. 将学习内容记录到文章里面,从#0001#开始

    使用一个Excel table 记录学习时间,每月底复盘分析!

    相关文章

      网友评论

          本文标题:#0001#我是如何与数据作朋友的

          本文链接:https://www.haomeiwen.com/subject/ieufcqtx.html