1.数据处理
1.1 数据清洗
- 重复数据的处理:COUNTIF法,删除重复数据法,透视表法等
- 缺失数据的处理:
- 方法一:用样本统计量的值代替,通常用样本平均值代替
- 方法二: 用统计模型计算出来的值代替,常见的模型有回归模型\判别模型
- 方法三: 将有后发制人值的记录删除,这会导致样本量减少
- 方法四: 将有缺失的记录保留,仅在缺失值 不大的情况下做分析时排除
- 方法五:查找替换
技巧
:CTRL+G 定位,Ctrl+Enter同时输入一个值
- 检查数据数据
- 用IF函数
- 用条件格式
1.2 数据加工
- 数据抽取:取出字段时需要的信息
- 字段分列法
- 函数 LEFT,MID,RIGHT截取法
- 字段合并:
&
连接字符,concatenate
合并函数,text
限定显示格式等 - 字段匹配:vlookup,lookup,hlookup等
- 数据计算
日期函数date,year,month,day,today,datedif的组合运用 - 数据分组
用vlookup,lookup等函数将数据分组,比如将43寸以下的电视定义为"小板",将43寸(含)-55寸的电视定义为"中板",将55寸(含)以上的尺寸定义为"大板" - 数据转换
- EXCEL的转置功能
- 二分法:用if,isnumber等将调查转为1或0的两种结果
1.3 数据抽样
rand,randbetween随机函数的运用
网友评论