一个弱渣的数据进阶规划

作者: Dathon数据分析 | 来源:发表于2021-06-24 21:03 被阅读0次

    (干货满满!)#大数据#  #数据分析#  #Python#  #开源#  #编程#  #人工智能#

                                                                                         记于2019年7月20日

           来我厂已半年(数分近两年),近半年主要提升是在编程能力的方面,算法相关的提升较少,其实心里还是比较着急的。目前知识结构比较散,想学的东西非常多,而且经常坑没开始,新坑就来了,所以打算做个简单的规划,主要把该做该学的记录起来,怕遗忘。

    1 ):做方面,主要是丰富自己为主,一个技术博客以及Github我觉得必不可少,相当于自身实力的代言了。算法方向方面,考虑了很久还是觉得以:推荐系统ctr营销相关算法为主。(目前博客和Github看起来毫无含金量)

    1.1、博客搭建:记录学习笔记、算法比赛思路、目前工作开发的一些东东

    1.2、Github : 记录算法比赛开源、自研工具代码等

    1.3、推荐系统ctr、营销相关等算法比赛。(旧的新的都行)

    2 )  :想学的坑太多,往后还是想往数据挖掘走,所以感觉有几个要学的还是无法避免。

    2.1、深度学习:目前比较浅掌握RNN、LSTM时间序列相关的(工作需要),但深度学习整体还是比较模糊,这块要尽快抓起来,暂时主要以《动手深度学习》:github.com/d2l-ai/d2l-z为主,吴恩达教学视频、《深度学习》为辅。

    2.2、 java:本来预计学C++,因为身边同事模型上线时候要写taf服务(C++),但考虑了N久,感觉还是先学一个万金油的一点比较好,担心C++太难,以及入门后应用部分没有学习资源的问题。主要以《java核心技术卷2》,其他资料待补充。

    2.3、leetcode medium难度:不多说,不刷找不到工作。

    2.4、hadoop深入及mapreduce的运用:主要还是有个数据处理自己用python需要8小时,数据开发的同事写mapreduce只要30分钟被打击到,感觉还是要掌握这块,不过同事吐槽我没写多线程也可能是原因。资料:icourse163.org/course/X

    2.5、Spark:这个不多说,目前岗位没用这个,但也是必须的工具,主要以pyspark进行学习,考虑精力在学scalar。资料:icourse163.org/course/X

    2.6、框架tensorflow、pytorch:目前只很浅的使用过tensorflow,框架这块还是要好好学。资料:官方文档

    2.7、Html、css、js:近期再开发自定义BI工具,深深体会到前端的薄弱,想做点产品,感觉这块还是需要的,虽然ployly.dash真得蛮好用,但这块html, css啥的也要比较懂才好发挥。资料:imooc.com/learn/9

    2.8、teableau:我厂的BI工具都是时序相关的,所以这个最主流的BI就我自学时候接触过,比较浅,感觉还是要深入一些。资料:官方文档

    2.9、可选项学习elasticsearch、redis:听得太多了,尤其是redis,这种缓存相关的我是完全不懂,感觉用得场景还是非常多的。资料:暂无

           大致就这些,预计1年的时间都入个门在稍微进阶一下,内容确实十分多的而且难度有,对于能不能完成自己也没底,近期工作、生活上还是比较忙碌的,但身处看天吃饭的行业,不进则退,要好好挤时间学习才行,简单说,就是学习 - 写博客 - 比赛 - 工作数据相关工具研发 - github如此循环。

           ps:有些同学反馈说技能太偏向技术,但数分还是偏业务的好。但我个人觉得,刚工作的几年最好以技术积累为主,当然不是说抛弃业务,而是用技术更好的服务业务,无论数分、数据挖掘甚至算法我觉得都是以业务为主导的。自己这么规划,主要也是我这个非科班生对技术的一点点追求吧。

    相关文章

      网友评论

        本文标题:一个弱渣的数据进阶规划

        本文链接:https://www.haomeiwen.com/subject/dwpgyltx.html