美文网首页
数据分析课程笔记

数据分析课程笔记

作者: MrHitchcock | 来源:发表于2020-03-29 16:09 被阅读0次

Excel基本数据分析

  • 数据处理阶段:


    数据处理函数
  • 数据分析阶段:


    数据分析函数

    vlookup函数 = VLOOKUP(lookup_value,table_array,col_index_num,[range_lookup])
    lookup_value:要查找的值,也被称为查阅值。
    table_array:查阅值所在的区域。请记住,查阅值应该始终位于所在区域的第一列,这样 VLOOKUP 才能正常工作。例如,如果查阅值位于单元格 C2 内,那么您的区域应该以 C 开头。
    col_index_num区域中包含返回值的列号。例如,如果指定 B2:D11 作为区域,那么应该将 B 算作第一列,C 作为第二列,以此类推。
    [range_lookup](可选)如果需要返回值的近似匹配,可以指定TRUE;如果需要返回值的精确匹配,则指定 FALSE。如果没有指定任何内容,默认值将始终为 TRUE 或近似匹配。

  • 数据可视化


    可视化库比较

SQL数据分析

  • 数据查询与过滤:基本语句掌握
  • 数据聚合


    聚合函数
    过滤聚合结果
    • where vs having


      区别
    • SQL核心语句


      核心语句
  • 数据CURD


    CURD
    总结
  • SQL进阶
    • 子查询


      子查询
    • 判断语句:case when...then...else...end


      判断语句

统计基础

  • 概率分布


    概率分布函数
  • 基本统计量


    统计量
    • 提升度和杠杆量


      提升度和杠杆量
  • 中心极限定理


    中心极限定理
    定理成立条件
  • 假设检验


    假设检验思路图
  • A/B测试


    A/B测试定义
    • 测试流程


      测试流程
    • 关于z检验和t检验 参考

R语言基础

  • 基本数据类型

  • 基本数据结构


    R语言数据结构
    • Vector 向量


      vector
    • List 列表


      list
    • Matrix 矩阵
      • cbind() 按列合并
      • rbind() 按行合并
      • dimnames(list) 给每行每列命名


        matrix
    • Data Frame数据框
      • data.frame(row,col) 生成数据库


        dataframe
    • Factor 因子
      • factor(c) 生成因子
      • summary() 总结分类情况


        factor
  • 数据处理

    • 取子集


      取子集方法
      实践
    • 强制类型转换


      强制转换方法
    • 排序
      • sort() 将数值从小到大排序
      • order() 将原数据元素从小到大排列的位置索引


        排序函数
    • 缺失值
      • sort(na.last=True) 将缺失值排在最后


        缺失值类型
  • 查看数据


    查看数据函数
  • 数据分析


    数学类函数
    分布类函数
    分布类函数总结
    • rnorm


      rnorm_1
      rnorm_2
  • 控制流


    循环-apply
  • 数据可视化


    ggplot2

机器学习数据分析

  • 数据分析方法对比


    对比

相关文章

网友评论

      本文标题:数据分析课程笔记

      本文链接:https://www.haomeiwen.com/subject/ehrsuhtx.html