美文网首页
知乎数据分析笔记

知乎数据分析笔记

作者: Pingouin | 来源:发表于2020-09-05 18:43 被阅读0次

    Ref: 数据科学家 (Data Scientist) 的核心技能是什么?

    数学

    至少线性代数(Linear Algebra)基础
    最好还有数值分析(Numerical Analysis)和统计(Statistics)的基础

    编程语言

    Python
    R,SQL,Tableau,这些面试中也经常出现,实战中也常常使用

    编程能力

    最好能把数据结构(data structure)学完,这样能在数据科学项目建模的时候也能更加顺畅

    建模能力

    • 对所有建模方法,都需要理论知识掌握+实际可以用Python或者R建立出来。重要模型包括不限于:所有的regression,classification,clustering,NLP,deep learning,A/B testing
    • 《Introduction to statistical learning》作为机器学习入门首选的一本书,涵盖面很广,而且通俗易懂(这本书在我的资料里面送)
    • Coursera的Machine Learning课程,是大名鼎鼎的Andrew NG教的,很扎实地入门数据学科和机器学习的从无到有
      练习方式:
      对于所有的机器学习方法,都要用笔记本记录它的理论依据,优点和缺点

    英语能力

    至少能看懂单词意思和基础语句,这个对编程至关重要

    练习方法

    • 对于所有的Python或者R常见的语法结构,用笔记本详细记录,这样在之后使用的时候会很方便查看已经熟能生巧。
    • SQL的练习我建议在熟悉了简单的语法之后,去Leetcode上去练习sql的题。基本上把Leetcode上题目都做出来就能出山了
    • Kaggle竞赛,是一个网上可以参与的数据科学竞赛,建议在数据科学学到一定程度的时候可以和队友一起参加,能完整体会到数据科学项目从0到1的一个过程
    • 练习商业/产品直觉,用英文说就是Business / Product Sense。这种练习其实一般是最后一步,但是却是最重要的:也就是当你的分析/模型都已经有结果了,如何把这些结果转化成真正有用的商业结果。我推荐的练习方式是在自己平时的学习过程中,每遇到一个问题,都去思考一下可能出现的不同模型结果和相对应你会传达出来的Business Insights。同样可以看一本书叫:《30 days Facebook PM Study Guide》,读完了也会有很大帮助

    相关文章

      网友评论

          本文标题:知乎数据分析笔记

          本文链接:https://www.haomeiwen.com/subject/qgufektx.html