美文网首页每天写1000字上班这点事儿@IT·互联网
一只想入行数据分析的小白和一只刚入职的小白之间的对话,高手慎入!

一只想入行数据分析的小白和一只刚入职的小白之间的对话,高手慎入!

作者: 夜未央mm | 来源:发表于2017-03-11 11:55 被阅读558次

    一:我想知道你平时的工作内容是什么呀?

    1.数据报表,进阶数据产品经理,进阶可视化BI体系;

    2.异常监控,进阶原因分析与业务方案,进阶公司业务监控与管理;

    3.数据需求,进阶向需求要产出,辅助推动全公司业务

    4.项目分析,进阶项目经理

    5.数据模型,进阶高级建模师

    是否属于这五个模块里面的?

    二:有没有你经常看的网站?

    三:你工作用的工具是什么?

    四:推荐几本和工作相关实用的书?

    五:其实我就是想知道怎么入门进去。现在只是对机器学习有初步的了解,知道一些智能算法。怎么正确的切入这个行业。

    前言

    看到你这么多问题,有点受宠若惊,我觉得你找前辈或者牛人指点,比我浅薄之见更有收获,相信你也早有此念,倘若有高人指点咱也可以共享一下哈,我这边把我的工作也给你汇报一二,仅供参考。

    另外由于在地铁里,有可能思路会像列车一样比较跳跃,如果有逻辑不清的地方也请见谅。下面切入正题,然而该换乘了。

    一、日常工作

    说实话,除了项目分析,其他几项都有覆盖,或者说涉猎。因为我的职位就是风险分析师,之前是数据分析师,二者的区别就是分析方向所在行业的不同,本质上都是通过分析数据达到指导业务的目标。

    公司在成长期会出现各种各样的业务问题,比如业绩不好,客户体验差,市场营销不到位,等等,数据分析师之于业务,就像医生之于病人,总是需要通过各种诊断分析来判断病因,然后对症下药制定策略方案,推动业务健康发展。

    而数据浩如烟海,我们就需要工具来装载盛放,于是就有了数据库,比如Oracle,Sqlserver,Mysql,Mongodb,Access等,有专门维护这些数据库和建表的同事,他们就是DBA和数据仓库ETL,做些底层清洗数据和建模工作,好的数据表结构,干净的底层数据离不开这些人的辛苦工作。

    数据报表团队则是根据业务方或者管理层需求,确定当下持续关注的指标进行一系列的常规报表开发,其实就是将底层数据处理成指标数据,为了美观需要做些比较炫的图形可视化,经济实用型的还是Excel,但也有一系列数据报表工具,比如Tableau,SmartBI,PowerBI,Cognos,R等。报表系统除了能够满足运营层管理层了解业务的目的,同时也有异常监控的作用,只是维度、粒度和精度有区别。所以我认为报表和监控是相辅相成的,二者都是结合常规需求来的。

    之所以说常规需求,是区别于临时需求,后者在目前报表系统或者监控报告中不够精细或者没有涵盖,就需要单独拎出来重点分析,通过横向交叉纵向对比,寻找历史规律,或者其他对业务有帮助的findings。

    而模型算法,或者说数据挖掘,也分几方面,算法类,工程类,前者偏应用,后者偏底层,甚至涉及开发等,我们这边有专门的模型团队和机器学习专家,所以我主要是使用他们模型输出结果,只是对他们的模型变量会有所了解。

    如上所述,我们最主要的产出还是策略调整,它不仅仅依赖于表面数据和模型算法,最重要的还是业务理解力,因为数据的收集过程有一种滞后性,再加上一些不可抗力和人为因素,所以和业务同事多沟通交流还是收获巨大的,他们会让你了解到策略变更后最直接的影响,以及上传下达后政策有没有贯彻执行。

    一句话总结,这门活计其实是科学和艺术的结合,既要会看数据懂模型,也要结合业务洞察人性。入门简单,但一入侯门深似海,你真会这样感觉的,因为这里有你一辈子都学不完的知识,每时每刻都要保持谦卑,可能再也没有时间去玩摄影了,就像我再也没时间写字一样。这也需要你自己去平衡。

    二、经常看的网站

    知道的网站还蛮多,但并没有养成经常看的习惯,主要是工作事情做不完啊,不过在知道自己短板的时候可以马上找到资源和组织,这个倒是挺有帮助的。

    统计之都,首次接触R的地方,作为一门开源统计软件必须强烈推荐,而且网站创始人谢益辉,刘思颉也都是行业前辈R骨灰级玩家,陈堰平及其雪晴数据网后来者居上,兴宝及其数据科学家联盟平分秋色,天善智能数据分析网也成掎角之势,当然还有其他组织者不一而足。公众号的话,也都琳琅满目,除了上述网站,也推荐之前有参与运营的R中文社区,现在也是搞的风生水起,另外一些行业专家的博客公众号也都值得关注,留心自有发现。

    三、工作用的工具

    Excel自不用多言,每天都会亲密接触,但是VBA依然止步不前,说来惭愧,要想深入了解它,不会VBA真的很难,因为它会像蒙娜丽莎的微笑一样神秘,但工作中也不算必需品。

    其次是SQL,作为查询语言仅次于Excel,但它相对简单,基本都是“Select * from table where condtion”这样的语句,一分钟就能上手,但要深入了解底层原理和其他高级功能,可能要付出很多。

    再次,数据查询也不单是SQL能实现的,如果你会用SAS R Python,连接上数据库也同样可以实现,所谓条条大路通罗马,只是每门语言的习性擅长领域不同而已,这和人是一样的。你用查询语言做分析不是不可以,可能就是麻烦点,和你用分析工具去查询一样,数据量小还是能够分分钟钟搞定的,但它的优点在于对数据探索数据分析这一块上,当然Python也可以做开发。

    所以,语言这一块如果有一定基础那就选择深入探索直到精通,如果零基础的话建议先了解你想要进入的行业甚至是公司,基本上你同事用什么你不自然地就跟着用什么了,而且遇到问题也能及时得到解决。

    四、荐书

    不管是语言还是行业,书籍都是汗牛充栋,学R你可以看《R语言编程艺术》《R初学者指南》,学SAS你可以看姚志勇写的《SAS编程与数据挖掘》,和《深入解析SAS》,学VBA可以看看《别怕,Excel VBA就是这么简单》,作图的话也可以看下《Excel图表之道》,甚至每门语言的帮助文档都可以精读。Python倒是没有专门去看书,只是看了点视频,在工作中用的并不多。

    五、怎么入门

    跟对人做对事,想入门最重要的是找个愿意带愿意培养你的人,这个过程着实坎坷,所以像找对象一样艰难,而且师傅领进门修行在个人,只要迈过了门槛,剩下的就是你自己的事情了。

    关于编程,我再多说点,其实是分享一下写给我小弟的一些话:

    在编程语言方面,实践重要但发现规律也很重要,在实践中不断总结思考,发现异同,触类旁通,可以促使你更快地学习其他语言,在工作中你会发现一门编程语言是不够的,因为每种语言都有它的局限性和适用领域,你也要在大方向上把握编程语言的发展,同时精通一门语言。小米创始人雷军有句话说的很好,不要以战术上的勤奋来掩盖战略上的懒惰。这句话适用于企业管理,同时也适用于学习,在学习中有目标导向,有循序渐进的方案,往往可以达到事半功倍的效果,而不是每天瞎忙却没有很大的进步和收获。

    后记

    昨晚和前同事聊到很晚,颇有感触,内心再强大也都需要心理辅导老师,天外有天人外人,你现在经历的也许就是别人走过的路,和智者同行会受益匪浅。

    职场之路并非坦途,太多谜团需要参悟,猜不透的就只能成为棋子,参透后有可能成为人精,再回首,却发现早已不似曾经那般模样。

    相关文章

      网友评论

        本文标题:一只想入行数据分析的小白和一只刚入职的小白之间的对话,高手慎入!

        本文链接:https://www.haomeiwen.com/subject/yhpagttx.html