美文网首页
谁说菜鸟不会数据分析-入门篇(第4章 三心二意--数据处理)

谁说菜鸟不会数据分析-入门篇(第4章 三心二意--数据处理)

作者: 表表哥 | 来源:发表于2017-07-20 17:41 被阅读14次

    1.数据处理

    1.1 数据清洗

    • 重复数据的处理:COUNTIF法,删除重复数据法,透视表法等
    • 缺失数据的处理:
      • 方法一:用样本统计量的值代替,通常用样本平均值代替
      • 方法二: 用统计模型计算出来的值代替,常见的模型有回归模型\判别模型
      • 方法三: 将有后发制人值的记录删除,这会导致样本量减少
      • 方法四: 将有缺失的记录保留,仅在缺失值 不大的情况下做分析时排除
      • 方法五:查找替换
        技巧:CTRL+G 定位,Ctrl+Enter同时输入一个值
    • 检查数据数据
      • 用IF函数
      • 用条件格式

    1.2 数据加工

    • 数据抽取:取出字段时需要的信息
      • 字段分列法
      • 函数 LEFT,MID,RIGHT截取法
      • 字段合并: &连接字符,concatenate合并函数,text限定显示格式等
      • 字段匹配:vlookup,lookup,hlookup等
    • 数据计算
      日期函数date,year,month,day,today,datedif的组合运用
    • 数据分组
      用vlookup,lookup等函数将数据分组,比如将43寸以下的电视定义为"小板",将43寸(含)-55寸的电视定义为"中板",将55寸(含)以上的尺寸定义为"大板"
    • 数据转换
      • EXCEL的转置功能
      • 二分法:用if,isnumber等将调查转为1或0的两种结果

    1.3 数据抽样

    rand,randbetween随机函数的运用

    相关文章

      网友评论

          本文标题:谁说菜鸟不会数据分析-入门篇(第4章 三心二意--数据处理)

          本文链接:https://www.haomeiwen.com/subject/ashjkxtx.html