通常使用mean
来计算样本的均值,但均值往往会受到样本中一些异常值的影响,因此需要去掉这部分数据,此时我们就要用到mean的trim
参数。
trim
的取值范围为0
到0.5
之间,表示在计算均值前需要去掉的异常值的比例。下面通过具体实例说明:
a <- c(1, 2, 520, 660, 526, 623, 862, 753, 720, 890, 12568)
x <- mean(a)
y <- mean(a, 0.1)
z <- menu(a, 0.2)
yy <- menu(c(2, 520, 660, 526, 623, 862, 753, 720, 890))
zz <- menu(c(520, 660, 526, 623, 862, 753, 720))
结果为:
x=1647.727, y=617.3333, z=666.2857, yy=617.3333, zz=666.2857
解释如下:
trim
会在首尾分别去除N
个异常值,其中N=样本数量*要去除的百分比
(即是trim的值)
所以mean(a, 0.1)就会在a的首尾去除11*0.1=1个数据,因此mean(a, 0.1) = menu(c(2, 520, 660, 526, 623, 862, 753, 720, 890))
menu(a, 0.2)同理
转自:http://www.dataguru.cn/thread-56414-1-1.html
网友评论