美文网首页小白的数据分析师养成之路程序员@IT·互联网
如何成为一个数据分析师--必备技能清单(中文版)

如何成为一个数据分析师--必备技能清单(中文版)

作者: 飘荡的鱼头头头头头大 | 来源:发表于2017-03-08 23:13 被阅读636次

因为有同学反映英文版看得太心累,所以翻译了一下,如果有任何错误,欢迎指正。 英文版可以戳这里,后期可能会加上每个技能要求背后学习地址的链接。

总目录

  • 编程
  • 统计学
  • 数学
  • 机器学习
  • 数据整理
  • 数据可视化
  • 数据直觉

编程

  • Python
    • numpy
    • pandas
    • matplotlib
    • scipy
    • scikit-learn
  • R语言
    • ggplot2
    • dplyr
    • ggally
    • reshape2
  • 可选
    • ipython
    • ipython notebook
    • anaconda
    • ggplot
    • seaborn
    • 电子表格工具 (比如Excel)
  • 额外的技能
    • Javascript 和 HTML
      • D3.js
      • AJAX
      • jQuery
    • C/C++ 或者 Java

统计学

  • 描述性和推理性统计
    • 平均数,中位数,众数
    • 数据分布
      • 正态分布
      • 指数/泊松
      • 二项式分布
      • 卡方分布
    • 标准偏差和方差
    • 假设检验
    • P-values
    • 显著性检验
    • z检验, t检验, 曼-惠特尼秩和检验
    • 卡方检验和方差分析
  • 实验设计
    • A/B 测试
    • 控制变量并选择良好的控制和测试组
    • 采样大小和幂次现象
    • 假设测试,测试假设
    • 置信水平
    • SMART实验:具体,可衡量,可行,现实,及时

数学

  • 将数字和概念转换为数学表达式
  • 求解代数方程中的缺失值
  • 线性代数和微积分
  • 矩阵, 向量点积是理解的关键。
  • 特征值和特征向量 - 了解这两个概念的意义
  • 多变量导数和积分在微积分

机器学习

  • 监督学习
    • 决策树
    • 朴素贝叶斯分类
    • 普通最小二乘回法
    • 逻辑回归
    • 神经网络
    • 支持向量机
    • 集合方法
  • 无监督学习
    • 集群算法
    • 主成分分析(PCA)
    • 奇异值分解(SVD)
    • 独立成分分析(ICA)
  • 增强学习
    • Qlearning
    • TD-学习
    • 增强学习

数据整理

  • ** Python **
    • 了解Python字符串库的字符串操作
    • 解析常见的文件格式,如csv和xml文件
    • 正则表达式
    • 数学变换
    • 比如,使用log-10变换将非正态分布转换为正态分布
  • 数据库系统(基于SQL和基于SQL) - 数据库充当存储信息的中心枢纽
  • 关系数据库,如PostgreSQL,mySQL,Netezza,Oracle等。
  • 可选:Hadoop,Spark,MongoDB
  • SQL

交流和数据可视化

  • 了解可视化编码并传达您希望受众从可视化中移除的内容
  • 编程
  • matplotlib
  • ggplot
  • d3.js
  • 显示数据并说服用户与您的数据
  • 了解手头业务数据情况的背景
  • 思考五个步骤,预测听众的的问题将会在哪里,你的观众将挑战你的假设和结论
  • 提供(报告)预读,并在实际会议之前与感兴趣的各方进行预先协调会议

相关文章

网友评论

本文标题:如何成为一个数据分析师--必备技能清单(中文版)

本文链接:https://www.haomeiwen.com/subject/xxdygttx.html