美文网首页小白的数据分析师养成之路程序员@IT·互联网
如何成为一个数据分析师--必备技能清单(中文版)

如何成为一个数据分析师--必备技能清单(中文版)

作者: 飘荡的鱼头头头头头大 | 来源:发表于2017-03-08 23:13 被阅读636次

    因为有同学反映英文版看得太心累,所以翻译了一下,如果有任何错误,欢迎指正。 英文版可以戳这里,后期可能会加上每个技能要求背后学习地址的链接。

    总目录

    • 编程
    • 统计学
    • 数学
    • 机器学习
    • 数据整理
    • 数据可视化
    • 数据直觉

    编程

    • Python
      • numpy
      • pandas
      • matplotlib
      • scipy
      • scikit-learn
    • R语言
      • ggplot2
      • dplyr
      • ggally
      • reshape2
    • 可选
      • ipython
      • ipython notebook
      • anaconda
      • ggplot
      • seaborn
      • 电子表格工具 (比如Excel)
    • 额外的技能
      • Javascript 和 HTML
        • D3.js
        • AJAX
        • jQuery
      • C/C++ 或者 Java

    统计学

    • 描述性和推理性统计
      • 平均数,中位数,众数
      • 数据分布
        • 正态分布
        • 指数/泊松
        • 二项式分布
        • 卡方分布
      • 标准偏差和方差
      • 假设检验
      • P-values
      • 显著性检验
      • z检验, t检验, 曼-惠特尼秩和检验
      • 卡方检验和方差分析
    • 实验设计
      • A/B 测试
      • 控制变量并选择良好的控制和测试组
      • 采样大小和幂次现象
      • 假设测试,测试假设
      • 置信水平
      • SMART实验:具体,可衡量,可行,现实,及时

    数学

    • 将数字和概念转换为数学表达式
    • 求解代数方程中的缺失值
    • 线性代数和微积分
    • 矩阵, 向量点积是理解的关键。
    • 特征值和特征向量 - 了解这两个概念的意义
    • 多变量导数和积分在微积分

    机器学习

    • 监督学习
      • 决策树
      • 朴素贝叶斯分类
      • 普通最小二乘回法
      • 逻辑回归
      • 神经网络
      • 支持向量机
      • 集合方法
    • 无监督学习
      • 集群算法
      • 主成分分析(PCA)
      • 奇异值分解(SVD)
      • 独立成分分析(ICA)
    • 增强学习
      • Qlearning
      • TD-学习
      • 增强学习

    数据整理

    • ** Python **
      • 了解Python字符串库的字符串操作
      • 解析常见的文件格式,如csv和xml文件
      • 正则表达式
      • 数学变换
      • 比如,使用log-10变换将非正态分布转换为正态分布
    • 数据库系统(基于SQL和基于SQL) - 数据库充当存储信息的中心枢纽
    • 关系数据库,如PostgreSQL,mySQL,Netezza,Oracle等。
    • 可选:Hadoop,Spark,MongoDB
    • SQL

    交流和数据可视化

    • 了解可视化编码并传达您希望受众从可视化中移除的内容
    • 编程
    • matplotlib
    • ggplot
    • d3.js
    • 显示数据并说服用户与您的数据
    • 了解手头业务数据情况的背景
    • 思考五个步骤,预测听众的的问题将会在哪里,你的观众将挑战你的假设和结论
    • 提供(报告)预读,并在实际会议之前与感兴趣的各方进行预先协调会议

    相关文章

      网友评论

      本文标题:如何成为一个数据分析师--必备技能清单(中文版)

      本文链接:https://www.haomeiwen.com/subject/xxdygttx.html