关于数据分析工作的最新分享(2020版)

作者: 数据蛙datafrog | 来源:发表于2020-01-30 20:02 被阅读0次

    今年的春节假期比以往的都要长些,把该唠的嗑、该刷的剧、该玩的游戏来一遍之后,大家逐渐开始回到了学习上。这里主要给大家分享数据分析工作中的一些内容,阅读路线如下:

    • 掌握哪些知识能够满足工作需要
    • 数据工作中需要避免的一些坑
    • 公司给不到成长如何解决

    一:掌握哪些知识能够满足工作需要

    刚开始学习的同学,一般会问,学习个数据分析怎么需要那么多知识呢?能不能掌握一些必要的知识,先入行,在公司中进行学习。是有的,咱们数据工作按照工作内容可以划分为两种,第一个是偏业务型、第二个是偏技术型

    1.偏业务型
    这样的职位,公司里一般称为数据分析师业务分析师运营分析等,工作内容方面主要是:从某个数据库或者公司某个平台下载一份数据,使用Excel进行数据的清洗、数据的汇总、以及绘图写PPT等;所需要的知识:excel熟练、mysql查询熟练、熟悉公司相应的业务

    2.偏技术型
    这样的职位,公司中一般称为数据工程师ETLBI等。工作内容,数据的清洗、数据汇总、绘图写PPT,猛然一听这不和上面业务型的一样吗?其实不一样的,举几个例子。

    如果领导提出一个需求,而你所需要的数据分布在10个库、100个表中,这怎么办呢?这肯定写一个sql语句下载1000次不能解决的。这里就要来写代码来进行,python、shell等脚本来处理。大家可以看下使用shell脚本把1000个表中的数据同步到hive库

    平常大家学习中,都是使用的windows系统,数据在自己某个盘的文件夹中,自己excel打开,或者用pandas 直接读取就可以直接处理数据和分析了。但是在公司中数据都在自家的服务器上(多半是linux系统),所以简单的linux命令需要掌握了,不然怎么在linux系统中运行代码,然后写代码的话一般在自己的电脑上写好,然后通过版本管理工具管理,再在linux中拉取代码。大家可以看下版本工具git使用

    在工作中一些日常的数据指标,如何来给领导呈现呢,如果是每天取数据、处理数据,进行呈现,这样就一直做重复工作,这时应该写写代码,进行数据的自动处理,然后通过可视化工具或者自动发送邮件进行呈现。大家可以看下实际工作例子可视化看板
    ,就如下面的

    对于偏技术型数据工作,重点需要掌握的技能python、hive、sql,以及业务知识等

    总结:大家基本能够看出偏业务型数据工作相比技能方面要求的比较低,如果着急的话,可以先满足需要的技能去找偏业务的数据工作,但是大家需要留意的是,这方面的工作,公司中的运营产品经理等业务职位都可以顺带给做了;所以能够找到是好的事情,找不到的话,增强硬技能,然后去找偏技术的就好,工资还会高了不少哈,关于偏技术的工作也不要怕,都是有套路和模板的

    二:数据工作中需要避免的一些坑

    刚开始工作的数据同学,常常会碰到一些坑,有些是自己挖的,有些是别人挖的,这里给大家分享下
    第一个坑:需求不明确:

    数据工作者平常和业务同学打交道是比较多的,做的最多的也是业务同学提出的需求,有几个要留意的
    a.对于业务同学提出的需求,一定要让他们出需求文档,并且对于计算指标一定要写好逻辑
    b.自己对于需求评估之后,和业务同学确定下来需要的时间,告诉他们哪天交给他们结果
    一开始工作的同学没有和业务同学确定需求指标逻辑、需求完成时间的习惯,很容易就出现扯皮的事情,比如说活跃用户的定义,你按照行业内标准来定义,但是业务同学可能不是这样来想的。

    第二个坑:没有及时反馈:

    关于反馈这个大家一定要重视起来,遇到不少刚工作的同学,在工作中不喜欢问别人,担心别人怀疑自己的能力,比如说:当你任务一半的时候,发现数据表中少了几个月的数据,影响到了任务,这时候一定要反馈给需求方一起评估造成的影响以及申请新的资源来进行协助。

    还有很多有意思的坑,比如你自己在A部门,但是你用B部门创建维护的表,然后那个表中的字段没有加注释,自己私下去找B部门相应同学问的话,如果迟迟不给你及时回复,那就不要等了,一定要反馈。这时候采用办法可以建立一个小群,拉上B部门维护这个表的同学、B部门的领导,自己A部门领导,需求方,在群里说明自己需要哪些协助。

    三:公司给不到成长如何解决

    公司中给不到成长,基本上很多同学都会碰到的,原因主要是大家都普遍自学转行,一开始掌握的都不太够的。如果是这样,分享个能够提高的地方:

    1.把工作中简单的任务按照正规数据项目给实现下
    很多同学一开始工作,普遍做的比较杂一些,技术方面比较弱些,很可能是excel数据处理、sql取数之类的,这时候,大家可以去额外的学习新的技能或者项目来用到自己的工作中。

    举个例子:比如说自己在公司中每次都是使用sql取数据,有时候会用sql写复杂的逻辑,但是运行速度慢或者说代码可读性不好,这时可以考虑使用pandas连接数据库 然后取出数据成dataframe,最后进行复杂的数据计算。这里给大家提一下,对于mysql 这样的数据库工具,做简单的查询是比较够用的,但是要求每日的留存率这样指标的话就不如pandas 这样的科学计算工具方便。大家可以了解下python和mysql的结合使用

    在公司中,本身业务知识是能够逐步积累的,只要学习些新的技能或者项目,然后融合到自己的工作中,下次找工作的时候肯定会上涨不少幅度的。

    最后祝大家新春快乐,出门做好防护

    相关文章

      网友评论

        本文标题:关于数据分析工作的最新分享(2020版)

        本文链接:https://www.haomeiwen.com/subject/ilvithtx.html